AI技术正在以前所未有的速度改变着我们的世界。近日,中国工程院院士、清华大学教授郑纬民在QCon北京大会上发表了题为《关于人工智能大模型的几点思考》的演讲,深入剖析了大模型推理架构Mooncake的核心创新与实际应用效果。
近日,中国工程院院士 / 清华大学教授 / 博士生导师郑纬民确认出席 QCon 北京大会发表题为《 关于人工智能大模型的几点思考 》的主题演讲,并将分享 Kimi 幕后的大模型推理架构 Mooncake。
郑纬民将在本次演讲中结合 Kimi 幕后的大模型推理架构 Mooncake 对以上问题进行深入剖析。Kimi 从初期频繁算力扩容仍宕机,到如今能平稳承载高速 ...
来自MSN4 个月
Kimi悄悄开源了自家推理框架Mooncake~Mooncake是为Kimi服务的平台,Kimi是由Moonshot AI提供的领先的大型语言模型(LLM)服务。 Mooncake以KVCache为中心的解耦架构,将预填充和解码集群分开。
据月之暗面消息,2月26日,Kimi与清华大学合作研发的Mooncake项目技术报告获得计算机存储领域顶会FAST 2025最佳论文奖。Mooncake是月之暗面Kimi的底层 ...
来自MSN4 个月
月之暗面Kimi携手清华等巨头,开源高性能大模型推理架构Mooncake在科技界的一次重大合作中,月之暗面Kimi与清华大学MADSys实验室携手,共同揭晓了他们酝酿已久的Mooncake推理系统设计方案。这一创新方案于2024年6 ...
02月26日 19:49 2月26日,Kimi 与清华大学合作研发的Mooncake项目技术报告获得计算机存储领域顶会FAST 2025最佳论文奖。Mooncake是月之暗面Kimi的底层推理 ...
Kimi与清华大学合作研发的Mooncake项目技术报告获得计算机存储领域顶会FAST 2025最佳论文奖。 2月26日,Kimi与清华大学合作研发的Mooncake项目技术报告 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果