对于运行Llama模型的Hopper架构系统,英伟达声称Dynamo可以有效使推理性能翻倍。而对于较大的Blackwell NVL72系统,GPU巨头声称在启用该框架的情况下,DeepSeek-R1相比Hopper具有30倍的优势。
具体到Blackwell系列工作站和服务器 GPU ,英伟达在去年3月发布了AI芯片与超级计算平台Blackwell架构,并推出了GB200芯片。 此外,英伟达还公布了继Hopper、Blackwell之后的下一代GPU架构Rubin——以在暗物质研究领域取得突破性进展的天文学家Vera Rubin命名,以及Rubin Ultra的计划配置。
3月17日到21日,英伟达年度 GPU 技术大会(GTC)召开。公司发布了全新的Blackwell Ultra GPU,以及在此基础上衍生的应用于推理、Agent的服务器SKU,也包括基于Blackwell架构的RTX全家桶。其中值得注意的是几款新产品的路线图,包括GB300以及Vera Rubin(包括标准版Rubin以及Rubin Ultra)。
为了提升效率,英伟达在软件上也有创新,提出了「AI 工厂的操作系统」——NVIDIA Dynamo。它是一个「分布式推理服务库」,而且是一个开源解决方案,解决的是用户需要 token 但无法提供足够 token 的问题。据介绍,Dynamo ...
在本周的 GPU 技术大会 (GTC) 上,Nvidia 的 Blackwell Ultra 以及即将推出的 Vera 和 Rubin CPU 和 GPU 成为了讨论的焦点。 但是这次年度开发者盛会最重要的公告之一可能并非芯片,而是一个名为 Dynamo 的软件框架,它旨在解决大规模 AI 推理的挑战。
在近期于美国举办的英伟达开发者大会(GTC)首日,英伟达的首席执行官黄仁勋向全球宣布了一个重要消息:继Blackwell之后,下一代名为Vera Rubin的AI数据中心芯片计划将于2026年下半年正式面世。这款全新的GPU架构,得益于NVLink ...
美国当地时间3月18日,英伟达开发者大会(GTC)首日,英伟达 CEO黄仁勋公布了Blackwell之后下一代GPU架构Rubin AI数据中心芯片的计划面世时间。英伟达预计,名为Vera ...
股价下跌并不一定意味着公司前景黯淡。虽然市场对英伟达在 GTC 2025 上的发布反应谨慎,但这并不排除这些技术在未来能够带来巨大收益的可能性。投资者的担忧主要集中在短期的财务表现上,而公司的长期战略和技术实力仍然具有巨大的潜力。
海外技术突破与国内资本开支形成“东西共振”,算力产业链将迎来新机会。本周英伟达召开GTC大会,以Blackwell Ultra芯片、Rubin架构、Quantum-X Photonics和Spectrum-X ...
刚刚,黄仁勋再次发布了全新一代核弹级 AI 芯片,不过这场发布会的还有个隐藏主角——DeepSeek。 由于智能体 AI(Agentic AI)和推理能力的提升,现在所需的计算量至少是去年此时预估的 100 倍。 推理成本效率给 AI ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果