资讯

沿着这一路径(强化学习),OpenAI 在训练计算量和推理时间方面都提升了一个数量级,但仍然看到了明显的性能提升,在跟 o1 相同的延迟和成本下,o3 的表现更强,而且给它更多时间思考,效果还能更好。
虽然“看图破案”的比喻略带夸张,但 o3 所展现的图像理解与推理能力,确实让我们离那个 “AI之眼”洞察万物 的未来,又近了一大步。 返回搜狐,查看更多 ...
在如今这个技术迅速发展的时代,人工智能的崛起让我们几乎忘记了过去解决问题时所必须依赖的人类智慧。然而,最近一项由卡内基梅隆大学(CMU)团队进行的研究彻底揭示了AI在公务员考试推理题上的尴尬表现,让我们不禁思考这背后的深意。
在科技领域的一次重大突破中,OpenAI于4月16日正式揭晓了其最新的推理模型——o3与o4-mini。据官方宣称,这两款模型标志着OpenAI在智能性和实用性上树立了新的里程碑。
作为更注重效率的Flash,在大模型竞技场上排名并列第二,第一是自家的Gemini 2.5 Pro。 目前,preview版本(不同于Gemini网页版中的版本)已在Google AI Studio和Vertex AI的 API中上线。
OpenAI 还分享了一项新实验:Codex CLI,这是一款可在终端运行的轻量级编程智能体。它可以直接在个人计算机上运行,最大限度地提升 o3 和 o4-mini 等模型的推理能力,并即将支持 GPT-4.1 等更多 API 模型。
机器之心报道作者:蛋酱这几天的大模型圈子,特别热闹。凌晨是 OpenAI 的 o3 和 o4-mini,一觉醒来,国内这边的豆包大模型又上新了一波。巧合的是,都是能看懂图像、能调用工具的新一代推理模型。就在今天上午,2025 火山引擎 Force ...
Skywork-OR1系列模型现已全面开源,模型权重、训练数据集和完整训练代码,所有资源均已上传至GitHub和Huggingface平台。配套的技术博客已发布于Notion平台,详细阐述了数据处理流程、训练方法和关键技术发现,为社区提供了完全可复现 ...
4月18日,科大讯飞与华为昇腾联合团队宣布,通过多种优化手段成功提升了“飞星一号”平台上MoE模型集群推理的性能上限,并在近期实现了大规模专家并行集群推理性能翻番。
深度推理大模型讯飞星火X1也即将全新升级,作为业界唯一基于全国产算力训练的深度推理大模型,X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用能力上显著提升,以小一个数量级的参数规模,实现整体效果对标OpenAI o1和DeepSeek R1,这也再次证明了基于国产算力训练的全栈自主可控大模型具备登顶业界最高水平的实力和持续创新的潜力,期待大家的关注和体验。
全球AI多模态生成加速引擎领导者 WaveSpeedAI ...