资讯
Llama 4 Scout,激活17B,16个专家,109B参数; Llama 4 Maverick,激活17B,128个专家,402B参数; Llama 4 Behemoth,激活288B,16个专家,2T参数。 Llama 4发布后排名 ...
不过Meta表示,更强大的一款被命名为Llama 4 Behemoth的大模型仍在训练中,该模型将在Meta的混合专家模型(MoE)架构中充当“新模型的老师”。
来自MSN18 天
Llama 4,超过DeepSeek了吗还有一个仍在训练中的基座模型Behemoth-2T(288B活跃,16专家)。 Llama 4 群从总体上实现了对DeepSeek V3.1的超越,如千万上下文,原生多模态,以及看起来更便宜的价格,但是它没有推理模型。Llama 4也超过了其他主要的开放权重或免费的小模型,如Gemma 3、Mistral 3.1和 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果