推理 - Search News

News

他写到：「众所周知，推理模型通常会生成较长的响应，这会增加计算成本。现在，这篇新论文表明，这种行为源于强化学习的训练过程，而并非更高的准确度实际需要更长的答案。当模型获得负奖励时，强化学习损失函数就倾向于生成较长的响应，我认为这能解释纯强化学习训练为 ...

17hon MSN

OpenAI新推理模型曝光：跨学科创新，月费14.5万，能否颠覆科研？

近期，科技界传来一则重磅消息，OpenAI即将推出其新一代AI推理模型，这一创新之举被业界视为AI技术的一大飞跃。据悉，这两款新模型分别被命名为o3和o4-mini，它们的核心竞争力在于能够跨越不同学科边界，整合各领域知识，并据此提出具有创新性的实验 ...

腾讯网10d

LLM「想太多」有救了！高效推理让大模型思考过程更精简

基于模型的高效推理：即考虑将模型优化为更简洁的推理模型，或直接训练高效推理模型。在回答「0.9和0.11哪个大」这个简单的问题时，DeepSeek-R1和QwQ-32B这两个模型给出的答案都十分冗长。

腾讯网3d

强化学习带来的改进只是「噪音」？最新研究预警：冷静看待推理模型的进展

机器之心报道编辑：蛋酱、+0「推理」已成为语言模型的下一个主要前沿领域，近期学术界和工业界都取得了突飞猛进的进展。在探索的过程中，一个核心的议题是：对于模型推理性能的提升来说，什么有效？什么无效？DeepSeek - R1 ...

最强32B中文推理大模型！DeepSeek-R1 1/20参数量还免费

Skywork-OR1系列模型现已全面开源，模型权重、训练数据集和完整训练代码，所有资源均已上传至GitHub和Huggingface平台。配套的技术博客已发布于Notion平台，详细阐述了数据处理流程、训练方法和关键技术发现，为社区提供了完全可复现 ...

上观新闻 on MSN2d

商汤最新强推理模型用来纠作业、比价格？掌门人徐立：我何以执念“百姓日用”

“夫人辅导孩子作业，常抱怨大模型‘拍照搜题’只给出答案，却讲不出错在哪儿。” 4月10日，商汤技术交流日，商汤科技董事长兼CEO徐立在上台演讲前45分钟接受记者专访，却尤为家常地探讨起大模型能否帮助“百姓日用”，如教学辅导、购物比价等。

WaveSpeedAI完成数百万美元天使轮融资，重塑AI推理基础设施格局

全球AI多模态生成加速引擎领导者 WaveSpeedAI ...

15h

商汤科技推出全新“日日新V6”大模型体系，全面提升AI推理能力

北京商报讯（记者魏蔚）4月15日，商汤科技正式发布了全新升级的“日日新SenseNova V6”大模型体系，这是其在AI技术领域的一大进步。通过多模态长思维链训练、全局记忆和强化学习等技术突破，该体系形成了领先的多模态推理能力，能够为用户带来更为直观和生动的智能体验。

华尔街见闻 on MSN7d

2025年斯坦福HAI报告：中美AI模型差距骤缩至0.3%，推理成本暴降280倍

2025年斯坦福HAI报告出炉：中国高性能AI模型的数量和质量不断提升，中美顶级模型性能差距缩至0.3%；推理成本暴降，小模型性能飙升；AI正变得更高效、更普惠。

品玩 on MSN1d

DeepSeek 公布推理引擎开源路径

品玩4月15日讯，据爱范儿报道，DeepSeek 悄悄在自己的 open-infra-index 库中发布了一份题为「开源 DeepSeek 推理引擎的路径」的文档，宣布将开源自己的内部推理引擎（internal inference engine），并与开源社区建立更广泛的合作。 DeepSeek 在文中致谢了 PyTorch 和 vLLM，两者分别在 DeepSeek 模型的训练框架以及推理引擎 ...

多模态推理模型Step-R1-V-Mini上线，阶跃星辰加速Agent落地

多模态推理模型Step-R1-V-Mini上线，阶跃星辰加速Agent落地,mini,推理,模态,step,agent,阶跃 ...

实测焱融存储：推理性能提升13倍，延时缩短超4倍

测试结论：在长上下文场景中，使用YRCloudFileKVCache可实现高达 13 倍的 TTFT 性能提升。这一显著优化得益于其高效缓存命中率和对大规模数据的快速处理能力，为大模型推理提供了更优的性能支持。

Some results have been hidden because they may be inaccessible to you

Show inaccessible results