NVIDIA 在 GTC 大会上发布了 Dynamo 软件框架,这是一个专为解决大规模 AI 推理挑战而设计的开源系统。CEO 黄仁勋将其比作"AI 工厂的操作系统",它能够优化 TensorRT LLM 等推理引擎,实现跨多 GPU ...
Nvidia的首席执行官Jensen Huang在GTC的演讲中将Dynamo称作“AI工厂的操作系统”,并将其与引发工业革命的发电机制相提并论,强调了其在未来AI领域的核心地位。他指出:“发电机是启动上一次工业革命的第一个工具。水进来,电出去。”从本质上来看,Dynamo是一个开源的推理套件,旨在通过优化推理引擎,如TensorRT ...
硬件方面: 英伟达发布基于Blackwell架构的升级版Blackwell Ultra,并着重强调了其在推理端的重大进展,可以为数据中心提供50倍增收的机会;英伟达也明确了26-27年乃至更远期的发展规划,硬件性能进一步加速已成定局;CPO交换机方面 ...
为了提升效率,英伟达在软件上也有创新,提出了「AI 工厂的操作系统」——NVIDIA Dynamo。它是一个「分布式推理服务库」,而且是一个开源解决方案,解决的是用户需要 token 但无法提供足够 token 的问题。据介绍,Dynamo ...
一年一度的GTC(GPU Technology Conference)又召开了,这个会算是英伟达的AI传教会了,不过又有点类似于武林盟主召开的武林大会,毕竟科技界的各路都来了,不但Meta,Open AI等科技企业,还有UC ...
具体到Blackwell系列工作站和服务器 GPU ,英伟达在去年3月发布了AI芯片与超级计算平台Blackwell架构,并推出了GB200芯片。 此外,英伟达还公布了继Hopper、Blackwell之后的下一代GPU架构Rubin——以在暗物质研究领域取得突破性进展的天文学家Vera Rubin命名,以及Rubin Ultra的计划配置。
具体到Blackwell系列工作站和服务器GPU,英伟达在去年3月发布了AI芯片与超级计算平台Blackwell架构,并推出了GB200芯片。 据悉,Blackwell Ultra是基于台积电N4P工艺的Blackwell GPU、Grace ...
本文转载自微信公众号:中信建投证券研究‍01PART目录通信 | 智能眼镜系列报告一:AI端侧的重要载体基金研究 | 科技行情之后哪些行业接力?金属和金属新材料 | 1-2月锑进出口数据公布,或与实际情况存在预期差非银金融 | 业绩稳健有支撑,政策红利有弹性人工智能 | 英伟达GTC 2025召开,发布新一代Vera Rubin平台医药 | ...
在拥抱不确定的过程中,黄仁勋也在不断地创造确定性。只是如今,英伟达的叙事逻辑需要全面更新。 这是黄仁勋对未来AI推理算力需求的预测。相对于行业所预测的「5-10倍」,多出了一个数量级。
《中国企业家》询问DeepSeek,“满分100分,给黄仁勋在2025 GTC的主题演讲打分”, DeepSeek给出了“85分”, DeepSeek解释说, 在技术深度和前瞻性上拿到了40分,但在商业转化和演讲内容呈现这两项,扣去了15分。
据彭博社援引知情人士消息,蚂蚁集团正通过中国自主研发的芯片开发AI模型训练技术,成功将成本压缩20%。其训练效果已与英伟达H800芯片相当,标志着国产芯片在高端AI领域的重大突破。‌知情人士透露,蚂蚁集团采用阿里巴巴、华为等国产芯片,结合混合专家模型 ...