DeepSeek 走红,让 “蒸馏” 成为大模型行业 1 月的讨论热点——不乏有研究人员怀疑,DeepSeek “蒸馏” 了 OpenAI 的领先模型,才有那么强的效果,截至目前还没有人拿出来证据。
当全球科技巨头在算力芯片和基础模型领域厮杀正酣时,一批嗅觉敏锐的资本正在悄然布局AI产业链的“终极应用层”——AI Agent赛道。这个被OpenAI首席执行官山姆·阿尔特曼称为“AI时代的超级接口”的领域,正在资本市场掀起结构性行情,根据咨询公司来觅PEVC的统计,自2024年以来,全球AI ...
最近美国科技圈可能有点慌——这边还没研究明白中国AI新秀DeepSeek的崛起密码,那边阿里云和字节跳动又甩出两张“王炸”:通义千问Qwen2.5-Max和豆包1.5-pro,直接在全球大模型擂台赛上秀了一波“中国功夫”,把ChatGPT、Claud ...
2025年2月,全球人工智能领域传来重磅旧闻。知名AI模型评测平台ChatbotArena(大模型竞技场)发布了最新的AI模型排行榜(ChatbotArena LLM ...
2 天
小熊财经 on MSNDeepSeek领跑AI赛道,OpenAI等巨头纷纷亮剑反击在新的一年里,科技的春风似乎比往年更加和煦,特别是人工智能领域,一股前所未有的热潮正席卷全国。如果说往年的春节还弥漫着传统的年味,那么今年,AI的气息无疑成为了节日里最鲜明的特色。
一个业界的共识是,Qwen最早扛起了中国AI大模型开源的大旗,也带起了一波开源的浪潮,孕育起一个AI生态。阿里云牵头建设的魔搭社区,已经上架了4万多个AI模型,服务超过1000万名开发者。
据财联社报道,刚刚, 李飞飞团队宣布,以不到50美元的云计算费用,成功训练了一个名为s1的人工智能推理模型 。成本之低,令人咋舌!而且s1的表现却毫不逊色于OpenAI的o1和DeepSeek的R1等尖端推理模型。
5 天on MSN
IT之家 2 月 5 日消息,1 月 29 日新年之际,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型,号称在多个基准测试中超越 DeepSeek V3 登竞争对手。 阿里云今日宣布,Qwen2.5-Max 在 ...
5 天on MSN
在近日的大模型竞技场中,一款来自中国的AI模型引起了广泛关注。这款名为Qwen2.5-Max的模型,由阿里巴巴公司推出,成功超越了多个国际知名模型,包括DeepSeek-V3、Claude 3.5 Sonnet以及Llama 3.1 ...
2月4日凌晨,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,一周前刚发布的Qwen2.5-Max超越DeepSeek ...
大年初一,阿里发出大模型新年第一弹。 北京时间1月29日凌晨1点半,阿里云通义千问旗舰版模型Qwen2.5-Max正式升级发布。据其介绍,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开 ...
阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家 (MoE)模型的时间较不寻常,正值农历新年第一天,大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果