Meta推出最强AI模型Muse Spark,但Gemini 3.1 Pro仍保持领先

Meta推出其最强大的AI模型Muse Spark,这是其超级智能实验室的首个产品。该模型具有原生多模态能力,在医疗推理和搜索方面表现优异,但在核心推理和编码方面仍落后于Gemini 3.1 Pro。这标志着Meta从开源转向封闭模型的战略转变。

Meta周三推出了Muse Spark,这是由Meta超级智能实验室构建的第一个模型——该团队是在九个月前Meta以140亿美元收购Scale AI后,在首席AI官Alexandr Wang领导下组建的。该模型现已在meta.ai和Meta AI应用中上线,未来几周将推广到Facebook、Instagram和WhatsApp。

这不仅仅是另一个聊天机器人升级或Llama的新版本。Muse Spark是原生多模态的——它从一开始就处理图像、文本和语音,而不是在现有文本模型上附加视觉功能。它配备了视觉思维链、工具使用支持,以及Meta称之为”沉思模式”的功能:一种并行运行多个AI代理以解决更困难问题的设置。这是Meta对谷歌Gemini Deep Think和OpenAI GPT Pro扩展思维模式的回应。

“Muse Spark是我们扩展阶梯的第一步,也是我们AI工作全面改革的首个产品,”Meta在官方公告中写道。”为了支持进一步扩展,我们正在整个堆栈进行战略投资——从研究和模型训练到基础设施,包括Hyperion数据中心。”

该公司与1000多名医生合作,为Muse Spark的医疗推理策划训练数据。在HealthBench Hard(开放式健康查询基准)上的结果令人印象深刻:Muse Spark得分为42.8,而GPT 5.4为40.1,Gemini 3.1 Pro仅为20.6。这不是边际差异。

在代理搜索(DeepSearchQA)方面,Muse Spark也以74.8领先,击败了Gemini(69.7)和GPT 5.4(73.6)。在CharXiv Reasoning(科学论文中的图表理解)方面,它得分为86.4,是所比较模型中最高的。

Muse Spark性能对比图表

但好不等于伟大。整体基准测试图显示,Gemini 3.1 Pro在大多数类别中仍然领先。差距在ARC AGI 2(抽象推理谜题基准)上最为明显:Gemini得分为76.5,而Muse Spark为42.5。

在编码(LiveCodeBench Pro)方面,Gemini的82.9超过了Meta的80.0。在MMMU Pro(多模态理解)方面,Gemini得分为83.9,而Meta为80.4。Meta自己的博客承认了当前在长视野代理系统和编码工作流程方面的性能差距。

这次发布还包含了一个显著的战略转变。Muse Spark是一个封闭模型——其架构和权重不会公开。这与Llama形成了鲜明对比,后者在开放AI圈子中建立了Meta的声誉。在今年早些时候Llama 4反响平平之后,Meta似乎决定下一章需要以不同的方式书写。

该公司表示希望开源未来版本的Muse,但目前代码仍保留在Meta内部。这家科技巨头的股票在周三公告后上涨了近9%,收盘时上涨6.5%至612.42美元。

“沉思模式”使用并行代理编排来推高模型的上限。在该配置中,Muse Spark在Humanity’s Last Exam上达到了58%,在FrontierScience Research上达到了38%——这使其能够与Gemini和GPT最强大版本竞争,而不是它们的标准版本。

Meta还在推出一个购物助手,可以比较产品并直接链接到购买,并计划在未来几周内将Muse Spark引入Facebook、Instagram和WhatsApp——遵循自Llama 3以来实施的相同脚本,将其呈现在超过35亿用户面前。私人API预览将向选定的开发人员开放。

该模型在九个月内构建完成,内部代号为Avocado,Meta声称其新的预训练堆栈可以使用超过10倍少的计算达到与Llama 4 Maverick相同的能力水平。

Muse Spark在内部被描述为Muse家族的”小而快”的第一步。一个更强大的版本已经在开发中。

本网站所有区块链相关数据与资料仅供用户学习及研究之用,不构成任何投资建议。转载请注明出处:https://www.lianxinshe666.com/2026/04/09/meta%e6%8e%a8%e5%87%ba%e6%9c%80%e5%bc%baai%e6%a8%a1%e5%9e%8bmuse-spark%ef%bc%8c%e4%bd%86gemini-3-1-pro%e4%bb%8d%e4%bf%9d%e6%8c%81%e9%a2%86%e5%85%88/

(0)
链新社的头像链新社
比特币矿企Cango出售1.43亿美元BTC,大幅削减生产成本
上一篇 2小时前
无聊猿游艇俱乐部创作者Yuga Labs与’表达性挪用艺术家’Ryder Ripps达成和解,结束长期商标纠纷
下一篇 2小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

风险提示:理性看待区块链,提高风险意识!