1 天
每日经济新闻 on MSN效率跃升1.71倍,字节再降MoE训练成本,为何AI玩家接连开源最新技术?3月10日,字节跳动豆包大模型团队发布针对MoE架构的通信优化系统COMET,旨在通过细粒度计算-通信重叠技术优化大模型训练。COMET已应用于万卡级生产集群,累计节省数百万GPU小时资源。随着DeepSeek等公司开源热潮兴起,更多大模型玩家也纷纷跟进,以扩大市场份额、构建生态系统并提升品牌形象。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果一些您可能无法访问的结果已被隐去。
显示无法访问的结果