据了解,Bolt Graphics 是一家成立不到 6 年的初创公司,由印度人 Darwesh Singh 在 2020 年创立,该公司在领英的主页上显示共有 20 位员工。该公司在 2021 年获得了第一轮融资,随后很快又于 2022 ...
IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布, 已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架 。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现混合并行训练和推理,提升了训练效率与稳定性。
IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布,已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU ...
NVIDIA 发布了开源推理软件 NVIDIA Dynamo,旨在以高效率、低成本加速并扩展 AI 工厂中的 AI 推理模型。作为 NVIDIA Triton 推理服务器的后续产品,NVIDIA Dynamo 是一款全新的 AI ...
据报道,字节跳动旗下豆包大模型团队近日宣布了一项关于混合专家架构的重要技术突破,并决定将这一成果开源,与全球AI社区共享。这一技术通过一系列创新方法,成功将大模型的训练效率提升了约1.7倍,同时显著降低了训练成本,降幅高达40%。开源不仅有助于加速行业技术发展能为更多研究者和开发者提供宝贵的资源,进一步推动人工智能技术的创新与应用。
刚刚,黄仁勋再次发布了全新一代核弹级 AI 芯片,不过这场发布会的还有个隐藏主角——DeepSeek。 由于智能体 AI(Agentic AI)和推理能力的提升,现在所需的计算量至少是去年此时预估的 100 倍。 推理成本效率给 AI ...
龙息神寂安卓玩家推荐骁龙865以上或者同性能级别的设备游玩,iOS玩家推荐最低苹果A10前片及以上(对应iPhone7系列)就可以玩了,一起来看看吧。
英伟达在GTC大会发布三代AI芯片BlackwellUltra、Rubin和Feynman,强调推理效率与成本优势。新一代芯片性能较前代提升显著,DeepSeek-R1模型在8块GPU上实现全球最快推理速度。同时推出AI工厂操作系统Dynamo、人形 ...
SK 海力士(或‘公司’, https://www.skhynix.com )19 日宣布,当地时间 3 月 17 日至 21 日在美国圣何塞(San Jose)参加由英伟达主办的全球 AI 领域的顶级峰会“GTC(GPU Technology Conference)2025”,将以“存储器,驱动人工智能与未来(Memory,Powering AI and Tomorrow)”为主题进行展示。
最终,DeepSeek R1 在 M3 Ultra Mac Studio 表现不错。虽然这里用的是 4-bit 量化版本,牺牲了一定的精度,但模型依然保持了完整的 6710 亿参数,速度为 16-18 ...
2025年3月18日,AMD 在北京举办了“ADVANCING AI”AMD AI PC 创新峰会,并联合生态伙伴公布了诸多AI PC软硬件新品。AMD董事会主席及首席执行官Lisa ...
3月19日,美光、SK 海力士两大 DRAM 内存原厂正式公布了新的 SOCAMM 内存模组。美光称该型内存条将被用于英伟达 GB300 Grace Blackwell Ultra 超级芯片,预计作为 Grace CPU 的可更换内存使用。