新闻中心

EEPW首页 > 业界动态 > Meta推出开源AI模型Llama 4

Meta推出开源AI模型Llama 4

作者: 时间:2025-04-08 来源:电子产品世界 收藏

由于DeepSeek等竞品引发压力,推出新一代集合 4。目前, 4拥有Scout和Maverick两个版本,均以形式发布。在声明中表示, 4是一个多模态系统,能够处理和整合文本、视频、图像、音频等多种数据类型,并能在不同格式之间实现内容转换。

本文引用地址:https://www.eepw.com.cn/article/202504/469153.htm

Llama 4系列是首款采用混合专家架构(MoE)的,这一架构在训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的“专家”子模型,实现精准而高效的处理。中国实验室DeepSeek模型的成功(其性能与Meta之前的旗舰Llama模型相当甚至更优)促使Llama开发进入加速模式,据说Meta组建了紧急工作组,以破解DeepSeek如何降低R1和V3等模型的运行和部署成本。

640-4.png

Scout版本配备170亿活跃参数、16个“专家”模型及1090亿总参数;而Maverick版本同样拥有170亿活跃参数,但“专家”模型数量增加至128个,总参数量飙升至4000亿。此外,Meta还预告了Llama 4 Behemoth,称其为“全球最聪明的语言模型之一,将作为未来模型训练的教师模型”。

Scout和Maverick已在Llama.com和Meta合作伙伴(包括AI开发平台Hugging Face)上公开提供,而Behemoth仍在训练中。Meta表示,其AI助手Meta AI已在40个国家的WhatsApp、Messenger和Instagram等应用中更新为使用Llama 4。多模态功能目前仅限美国地区使用英语。

Meta尚未发布的Behemoth将需要更强大的硬件,拥有2880亿活跃参数、16位专家和近2万亿总参数。Meta的内部基准测试显示,Behemoth在衡量数学问题解决等STEM技能的多项评估中优于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro(但不及2.5 Pro)。

Llama 4模型系列中没有一个是类似OpenAI的o1和o3-mini那样的真正"推理"模型,推理模型会对其回答进行事实检查,通常对问题的回应更可靠,但因此比传统的"非推理"模型需要更长时间来提供答案。另外,Meta表示它调整了所有Llama 4模型,使其拒绝回答"有争议"问题的频率降低,表示Llama 4在处理它完全不会回应的提示方面"平衡性大大提高"。

但是值得注意的是,Llama 4在内部基准测试中“表现不佳”,尤其是在数学处理能力和推理能力方面。虽然目前Llama 4仍需更多时间优化,据称扎克伯格此前给全员下了死命令,4月底是Llama 4交付最后期限。



关键词: Meta 开源 AI 模型 Llama

评论


相关推荐

技术专区

关闭