Math - 搜索 News

5 小时

李萌表示，对于大模型的业界开发者来说，如果只做工程等于是必死无疑。因为，大模型不仅需要工程能力，还需要学术研究能力。而对于没有太多 GPU 的学界来说，基于 DeepSeek 同样能有很多研究方向值得探索。

17 天

阿里云通义Qwen2.5-Math-PRM：7B模型超越GPT-4o，数学推理新突破

1月16日消息，阿里云通义团队发布了新一代数学推理过程奖励模型——Qwen2.5-Math-PRM。该模型引入了72B与7B两种尺寸，其在推理过程中的表现显著优于现有的开源模型，尤其在推理错误识别方面，7B版本的性能甚至超过了闭源的GPT-4o。这一创新不仅为智能推理提供了新的可能性，也为相关领域的技术进步注入了新的活力。 Qwen2.5-Math-PRM模型的设计旨在解决大型语言模型在处理推理时 ...

腾讯网4 小时

DeepSeek到底是真开源还是假开源？业内人士：已有足够多细节值得学习

近日，在国内某问答平台上，一则关于 DeepSeek 的提问登上问题热门排行榜。这一问题的描述是：“如何评价 DeepSeek 自称开源？但似乎并未开源（Open Source），仅为 Open Model?”（来源：资料图）那么，DeepSeek ...

腾讯网4 小时

从特朗普政府“星际之门”到 DeepSeek：是什么在左右全球科技、经济 ...

特朗普政府上任伊始就展现了对AI领域的雄心壮志。1月21日，特朗普在白宫宣布了名为"星际之门"的庞大AI基础设施计划，预计在未来四年内投资5000亿美元，用于建设支持AI发展的基础设施（点击查看相关报道）。这一计划由OpenAI、软银集团和甲骨文公司 ...

腾讯网14 小时

o3-mini物理推理粉碎DeepSeek R1？全网最全实测来袭

新智元报道编辑：KingHZ 桃子【新智元导读】一场改写AI历史的震撼对决正在上演！就在昨天，当DeepSeek ...

14 小时

o3-mini物理推理粉碎DeepSeek R1，OpenAI王者归来！全网最全实测来袭

【新智元导读】一场改写AI历史的震撼对决正在上演！就在昨天，当DeepSeek R1还在用「降维打击」重构AI格局时，OpenAI王者回归之作o3-mini已悄然降临，用实力证明——王者，从未离场！

17 天

阿里云通义推出Qwen2.5-Math-PRM模型与首个推理评估标准

在科技快速发展的今天，阿里云再一次为人工智能领域推陈出新。1月16日，钛媒体App报道了阿里云通义开源了全新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一模型的推出，标志着在72B与7B尺寸下，其性能远超同类开源过程奖励模型。

IT之家22 天

微软 rStar-Math 技术登场：小语言 AI 模型数学推理从“不及格”一跃 ...

IT之家1 月 11 日消息，微软亚洲研究院旗下数学和人工智能研究团队昨日（1 月 10 日）发布博文，针对小语言模型，设计并开发了 rStar-Math 技术，专门用于解决数学问题。和微软之前推出的 Phi-4 不同，rStar-Math 采用蒙特卡洛树搜索（Monte Carlo Tree Search）进行推理 ...

5 天

当AI成本降低30倍：DeepSeek-R1如何重塑AI行业

DeepSeek-R1 的发布及其引发的全球复现热潮，正在从根本上改变 AI 产业的格局。这种改变首先体现在开发成本上。R1 将每百万 token 的价格从 o1 的 60 美元降至 2.19 美元，这种近 30 倍的价格差异足以改变企业的 AI ...

来自MSN6 天

全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

编辑：编辑部 HYZ 【新智元导读】就在刚刚，网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现，只用强化学习，没有监督微调，30美元就能见证「啊哈时刻」！全球AI大模型，或许正在进入下一分水岭。

来自MSN10 天

如何评价 Kimi 发布的多模态推理模型 k1.5？

从技术报告看，K1.5的亮点是真的不少。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果