Qwen 团队是中国电商巨头阿里巴巴的一个部门,专注于开发其不断扩展的开源 Qwen 大语言模型(LLM)系列。该团队推出了 QwQ-32B,这是一种新的 320 亿参数推理模型,旨在通过强化学习(RL)提高复杂问题解决任务的性能。
由于中国AI企业DeepSeek开发出了高性能的低成本大语言模型,2025年1月下旬,英伟达(NVIDIA)等美国高科技公司的股价暴跌。“DeepSeek冲击”这一说法,可能模仿了前苏联在1957年成功发射全世界第一颗人造卫星“斯普特尼克1号(Spu ...
在过去的三个月里,中国大模型创业公司DeepSeek和AI应用创业公司Manus如同一股狂潮,激荡着全球AI市场,快速改变着硅谷、阿里巴巴等巨头们的既定发展路径。根据DeepSeek的研究,投入2048张英伟达H800芯片以及558万美元的训练成本,他们研发的DeepSeek-V3已与OpenAI的明星模型GPT-4o相媲美,令人赞叹不已。
随着数以百万计的用户涌入平台,DeepSeek的聊天机器人经常出现服务中断。 出于数据安全方面的考虑,世界各地主管部门正在限制其使用。 美国在考虑采取一些措施,包括禁止DeepSeek在其政府设备上使用。 其他网络公司则正在利用DeepSeek的免费代码来推进自己的业务。
原文作者:Jacob Dreyer通过押注AI,中国希望能开发面向全球市场,尤其是低收入国家的成本效益高的实用商业工具。中国巨大的消费市场或推动“具身人工智能”(embodied ...
在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。
2024年底我在推特上看到这么一条推文,时间是恰逢DeepSeek声名鹊起的时刻,但这个博主并没有一味的提DeepSeek,而是是说中国的AI军团不只是DeepSeek,还有一大堆的干将。
DeepSeek今年1月底推出AI模型R1,其以极低成本达到与OpenAI o1模型一样的表现,让外界相当惊艷,如今DeepSeek又有大动作,日前宣布举行「开源周」,共开源5个代码库(repository),以完全透明的方式分享公司新进展 ...
在初始阶段专门针对数学和编码任务扩展强化学习,没有依赖传统的奖励模型,而是使用一个数学问题准确性验证器来确保最终解决方案的正确性,并使用一个代码执行服务器来评估生成的代码是否成功通过预定义的测试用例。
在科技的快速发展浪潮中,阿里巴巴的Qwen团队再一次用其前瞻性的研究成果震撼了业界——QwQ-32B大型语言模型横空出世,成为热议的焦点。与6710亿参数的DeepSeek-R1相比,QwQ-32B仅以320亿参数的身姿展现出了强大性能,这无疑令业界惊叹。这一切都得益于Qwen团队在强化学习领域取得的重大突破,让QwQ-32B在参数数量仅占DeepSeek-R1的约1/21时,依旧能够实现出色的表 ...
当大家讨论为什么 DeepSeek 能够形成全球刷屏之势,让所有厂商、平台都集成之时,「开源」成为了最大的关键词之一,图灵奖得主 Yann LeCun 称其是「 ...
Hace poco, la empresa china de inteligencia artificial (IA) DeepSeek causó sensación en el mundo con el lanzamiento de su ...