comet - 搜索 News

8 小时

团队“DeepSeek”化，字节 Seed Edge启动不足两月，冲刺AGI再发新作 ...

1 月下旬，字节正式设立代号为“Seed Edge”的研究项目，目标是探索 AGI 的新方法，其中“Seed”是豆包大模型团队名称，Edge 代表最前沿的 AGI 探索。 1 月下旬，字节正式设立代号为“Seed Edge”的研究项目，目标是探索 ...

中文科技资讯9 小时

科大讯飞依靠国产算力卡成功进入大模型研发梯队

近日，科大讯飞在互动平台上回答投资者提问，透露了其在国产算力领域的最新进展，引发广泛关注。科大讯飞表示，凭借仅仅1万张910B 国产算力卡，他们已经跻身于大模型研发的第一梯队。这一成绩令人瞩目，因为同类企业在此领域所需的算力往往远超此数。

10 小时

已节省数百万GPU小时！字节再砍MoE训练成本，核心代码全开源

早前，豆包团队发布了新一代稀疏架构UltraMem，将模型推理成本砍掉 83%，此次，又开源了COMET，向模型训练成本出手。从技术理念上看，两者还可以结合使用，组成一套“砍价刀法” 。

12 小时

国产大模型再上一分！有道大模型翻译质量实测达全球第一

当业界还在热议DeepSeek-R1开源战略对AI生态的重构、持续探讨Manus智能Agent的技术突破时，国产大模型已在垂直赛道实现关键性跨越。3月11日，网易有道宣布完成翻译底层技术迭代，基于自主研发的子曰翻译大模型2.0，在测试中实现翻译质量超 ...

中文科技资讯15 小时

大模型效率狂飙：字节COMET技术开源，提速1.7倍

字节跳动旗下豆包大模型团队近日宣布，成功攻克混合专家模型 (MoE)架构的关键瓶颈，并开源一项名为COMET的重大优化技术。该技术显著提升了大模型的训练效率，实现了高达1.7倍的效率提升，并有效降低了40%的训练成本。

15 小时

有道大模型翻译技术再突破，小参数垂类模型实现翻译质量全球第一

当业界还在热议DeepSeek-R1开源战略对AI生态的重构、持续探讨Manus智能Agent的技术突破时，国产大模型已在垂直赛道实现关键性跨越。3月11日，网易有道宣布完成翻译底层技术迭代，基于自主研发的子曰翻译大模型2.0，在 ...

17 小时

AI时代来袭！学习AI的紧迫性与零门槛工具推荐

近日，广东省印发《推动人工智能与机器人产业创新发展若干政策措施》，标志着AI技术在我国将迎来新一轮爆发。与此同时，字节跳动开源的COMET技术将大模型训练成本降低40%，再次证明AI技术正在快速迭代。

18 小时

字节开源MoE关键优化技术，训练成本再砍40%！内部万卡集群已部署

新浪科技讯 3月10日晚间消息，字节豆包大模型团队官宣开源一项针对 MoE 架构的关键优化技术，可将大模型训练效率提升1.7倍，成本节省40%。据悉，该技术已实际应用于字节的万卡集群训练，累计帮助节省了数百万 GPU 小时训练算力。 MoE 是当前大模型的主流架构，但其在分布式训练中存在大量跨设备通信开销，严重制约了大模型训练效率和成本。以海外主流模型Mixtral-8x7B为例，其训练过程中通 ...

腾讯网18 小时

社交媒体X频繁宕机，马斯克称遭遇大规模网络攻击；字节开源MoE架构 ...

每经记者：蔡鼎每经编辑：高涵｜2025年3月11日星期二｜NO.1 字节开源MoE架构优化技术，训练成本省40% 字节跳动豆包大模型团队官宣开源一项针对MoE（混合专家模型）架构的关键优化技术，可将大模型训练效率提升1.7 ...

品玩 on MSN1 天

字节跳动豆包大模型团队开源MoE架构优化技术

品玩3月11日讯，据界面新闻报道，字节跳动豆包大模型团队近日开源一项名为COMET的MoE架构优化技术，可将大模型训练效率提升1.7倍。论文显示，该技术已实际应用于字节的万卡集群训练，实现数百万GPU小时训练算力的节省。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果