在论文发布的版本里,作者评测了包括 GPT-4o,Claude-35-Sonnet, Gemini-1.5-pro-preview 等17个当时最领先的 LLM,每两个模型在每个游戏上进行20轮相互对抗赛(10 轮先手 10 ...
全球AI产业周报为你精选过去一周(3.22-3.28)最值得关注的AI新闻和国内外热门AI投融资事件,帮助大家及时了解全球AI市场动向。一、本周AI热点资讯国内大事DeepSeek梁文锋首登全球富豪榜:财富超OpenAI ...
目前MC-Bench的榜单上,Claude3.7暂时领先,deepseek-r1位列第5,但是考虑到DeepSeek-R1的发布时间,Claude3.7、GPT-4.5和Gemini2.0都相当于是「新一代」的模型了,期待DeepSeek-R2出来后 ...
DeepSeek绝对会在中国AI发展史上,留下浓墨重彩的一笔。其DeepSeek性能优越,被一些美国人称为“人工智能的斯普特尼克时刻”,认为它的威力不亚于冷战期间苏联发射首颗人造卫星“斯普特尼克1号”,对美国产生的冲击。
对于视觉推理模型,阿里的野心和意图都非常明显。早在去年 12 月,阿里 Qwen 团队就探索性地推出了 QVQ-72B-Preview 视觉推理模型。到了今年 1 月,又为雷鸟创新打造了用于雷鸟 V3 AI 眼镜的定制模型。
对比同类产品豆包、元宝发现,通义APP投放力度虽然大幅上涨,但依旧不及豆包和元宝。进入3月份,豆包投放力度稍有下滑,日投放素材量约1万组左右;元宝投放力度则持续上升,近期稳定在日头发素材量3.5万组左右。
作为对比,不同于互联网公司的大跃进式招聘,那些一开始走向行业潮头的新兴公司,反而显示出不断缩编的迹象。自去年开始,包括MiniMax、月之暗面、零一万物、智谱在内的AI公司接连传出裁员消息,当年从大厂出走的技术骨干也陆续出现回流迹象。