今年1月,中国人工智能公司深度求索发布了备受瞩目的DeepSeek-R1模型。这款模型引入了创新性的Mixture of ...
如今,科大讯飞携手华为再度攻克国产算力领域的难关,联合研发的团队创造性地推出了基于国产算力的MoE模型的全新解决方案。在这一背景下,该方案不仅标志着国产算力技术的重大进步,更是业界继DeepSeek模型之后的又一革命性成果。
今年1月,中国人工智能公司深度求索发布了令人瞩目的DeepSeek-R1模型,采取创新的MoE架构和高效的训练方法,使得其在保持高性能的同时实现了较低的算力需求。这是大模型平衡规模与效率的一次重要探索,众多主流大模型企业也纷纷加码MoE架构创新。
近日,DeepSeek发布了视觉多模态模型DeepSeek-VL2。该模型在视觉能力上进行了显著升级,采用了MoE(Mixture of Expert)架构和动态切图策略,支持动态分辨率图像处理。
Preface前言杨松琳专注于线性注意力机制、机器学习与大语言模型交叉领域,聚焦高效序列建模的硬件感知算法设计,围绕线性注意力、循环神经网络优化开展研究,并取得多项研究成果,多篇论文被 ICLR 2025、NeurIPS 2024 ...
2025年政府工作报告再度强调 “人工智能 ...
2025年3月10日,智元机器人正式发布了他们的最新力作——“智元启元大模型”,这一突破性的发布标志着该公司在机器人领域迈出了具有里程碑意义的一步。这个通用具身基座模型,毫无疑问,将会对人形机器人与现实环境的交互方式产生深远的影响。让我们一同走进这个新技术的背后,看看它如何影响未来的机器人市场,并且如何在当前的技术环境下引发业界和公众的广泛关注。 智元启元大模型的发布,吸引了无数目光。作为该公司首 ...
生成式AI浪潮在2023年底席卷全球后,乐天集团(Rakuten Group)随即于2024年初发布AI战略“Triple ...
昨晚美股市场经历剧烈波动,特斯拉股价跌停,自历史高点已下跌超过50%。尽管特斯拉过去多次经历大幅回调后仍能实现反弹创新高,但此次情况有所不同。 马斯克因深度参与政治活动而引发市场担忧。其商业才能虽已得到证明,但此次跨界涉足政治可能分散了对公司业务的关注。特斯拉目前在自动驾驶领域仍保持微弱优势,但其他业务如机器人等并不领先。 市场普遍认为,若马斯克不能将精力重新放回公司业务,特斯拉将面临较大风险。其 ...