Mixture - 搜索 News

21 小时

国产算力的MoE模型革命：科大讯飞与华为的突破不容错过

今年1月，中国人工智能公司深度求索发布了备受瞩目的DeepSeek-R1模型。这款模型引入了创新性的Mixture of ...

13 小时

科大讯飞与华为联手：开创大模型新纪元，助力国产算力崛起

如今，科大讯飞携手华为再度攻克国产算力领域的难关，联合研发的团队创造性地推出了基于国产算力的MoE模型的全新解决方案。在这一背景下，该方案不仅标志着国产算力技术的重大进步，更是业界继DeepSeek模型之后的又一革命性成果。

腾讯网13 天

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

23 小时

国产算力适配先进算法创新

今年1月，中国人工智能公司深度求索发布了令人瞩目的DeepSeek-R1模型，采取创新的MoE架构和高效的训练方法，使得其在保持高性能的同时实现了较低的算力需求。这是大模型平衡规模与效率的一次重要探索，众多主流大模型企业也纷纷加码MoE架构创新。

腾讯网6 天

用好DeepSeek-VL2的心法，就在上交大ACM班俞勇教授团队的这本新书里

近日，DeepSeek发布了视觉多模态模型DeepSeek-VL2。该模型在视觉能力上进行了显著升级，采用了MoE（Mixture of Expert）架构和动态切图策略，支持动态分辨率图像处理。

人人都是产品经理 on MSN18 天

混合专家架构（MoE）与 Transformer 融合的·深度解读

在人工智能领域，混合专家架构（MoE）与Transformer架构的融合正在成为推动大模型发展的新趋势。文章深入剖析了MoE架构的核心理念、优势以及与Transformer架构的融合方式，探讨了这种融合如何提升模型的计算效率、扩展性和适应性，供大家参考。 DeepSeek 采用的创新混合专家架构（MoE，Mixture of Experts）是其技术核心，也为大模型的发展带来了全新的思路和方向。那 ...

China.com on MSN5 天

智元机器人突破性进展！国家队重仓16亿加码，独家代工方揭秘！

2025年3月10日，智元机器人正式发布了他们的最新力作——“智元启元大模型”，这一突破性的发布标志着该公司在机器人领域迈出了具有里程碑意义的一步。这个通用具身基座模型，毫无疑问，将会对人形机器人与现实环境的交互方式产生深远的影响。让我们一同走进这个新技术的背后，看看它如何影响未来的机器人市场，并且如何在当前的技术环境下引发业界和公众的广泛关注。智元启元大模型的发布，吸引了无数目光。作为该公司首 ...