GPU Memory - 搜索 News

老黄 5090 都被初创公司虐了？印度 CEO 用 20 人团队让芯片快10 倍 ...

据了解，Bolt Graphics 是一家成立不到 6 年的初创公司，由印度人 Darwesh Singh 在 2020 年创立，该公司在领英的主页上显示共有 20 位员工。该公司在 2021 年获得了第一轮融资，随后很快又于 2022 ...

11 天

GPU “吸金王” ！壁仞科技再融资，冲刺中国英伟达王座！

2022年8月9日，壁仞科技首款通用GPU芯片BR100震撼发布，一举创造全球算力纪录，在国内率先应用了Chiplet技术、新一代主机接口PCIe 5.0、CXL互连协议等多项先进技术，成功打破国际巨头长期以来的垄断局面。

5 天

摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架

IT之家 3 月 17 日消息，摩尔线程官方今日发文宣布，已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库，在国产全功能 GPU 上实现混合并行训练和推理，提升了训练效率与稳定性。

腾讯网5 天

摩尔线程开源 MT-MegatronLM、MT-TransformerEngine AI 框架

IT之家 3 月 17 日消息，摩尔线程官方今日发文宣布，已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库，在国产全功能 GPU ...

腾讯网3 天

NVIDIA Dynamo开源库加速并扩展AI推理模型

NVIDIA 发布了开源推理软件 NVIDIA Dynamo，旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理模型。作为 NVIDIA Triton 推理服务器的后续产品，NVIDIA Dynamo 是一款全新的 AI ...

4 天

摩尔线程重磅开源两大AI框架，国产GPU训练效率突破90%

据报道，字节跳动旗下豆包大模型团队近日宣布了一项关于混合专家架构的重要技术突破，并决定将这一成果开源，与全球AI社区共享。这一技术通过一系列创新方法，成功将大模型的训练效率提升了约1.7倍，同时显著降低了训练成本，降幅高达40%。开源不仅有助于加速行业技术发展能为更多研究者和开发者提供宝贵的资源，进一步推动人工智能技术的创新与应用。

1 天

刚刚，黄仁勋甩出三代核弹AI芯片，个人超算每秒运算1000万亿次 ...

刚刚，黄仁勋再次发布了全新一代核弹级 AI 芯片，不过这场发布会的还有个隐藏主角——DeepSeek。由于智能体 AI（Agentic AI）和推理能力的提升，现在所需的计算量至少是去年此时预估的 100 倍。推理成本效率给 AI ...

虎嗅网3 天

黄仁勋甩出三代核弹AI芯片，DeepSeek成最大赢家

英伟达在GTC大会发布三代AI芯片BlackwellUltra、Rubin和Feynman，强调推理效率与成本优势。新一代芯片性能较前代提升显著，DeepSeek-R1模型在8块GPU上实现全球最快推理速度。同时推出AI工厂操作系统Dynamo、人形 ...

14 天

ICLR 2025 | 英伟达提出FP8训练新范式：减少40%显存占用，训练加速1.43倍

近期DeepSeek V3 引爆国内外的社交媒体，他们在训练中成功应用了 FP8 精度，显著降低了 GPU 内存使用和计算开销。这表明，FP8 量化技术在优化大型模型训练方面正发挥着越来越重要的作用。

3 天

SK 海力士将在 GTC 2025 上展示业界顶级存储器技术实力

SK 海力士（或‘公司’， https://www.skhynix.com ）19 日宣布，当地时间 3 月 17 日至 21 日在美国圣何塞（San Jose）参加由英伟达主办的全球 AI 领域的顶级峰会“GTC（GPU Technology Conference）2025”，将以“存储器，驱动人工智能与未来（Memory，Powering AI and Tomorrow）”为主题进行展示。

5 天

苹果杀疯了，Mac Studio内存狂飙，跑满血DeepSeek R1消耗448GB，M3 Ultra竟然 ...

最终，DeepSeek R1 在 M3 Ultra Mac Studio 表现不错。虽然这里用的是 4-bit 量化版本，牺牲了一定的精度，但模型依然保持了完整的 6710 亿参数，速度为 16-18 ...

什么值得买社区频道 on MSN1 天

9950X3D VS 9950X VS 9800X3D深度测试，含调度分析|模拟游戏对比

目前综合性能最强处理器AMD锐龙9 9950X3D已经发售一周了，虽然定位旗舰售价不便宜，但是它的受欢迎程度不亚于之前还没暴雷的英特尔酷睿i9，这颗U的定位就是生产力和高端游戏共存用途，对于热衷折腾的玩家，调教一下游戏性能可远远甩开锐龙7 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果