AI模型
-
弗兰肯斯坦式AI融合Claude Opus、GLM和Qwen,性能超越顶级模型
AI工程师凯尔·赫斯林成功将Claude Opus、GLM和Qwen三个顶级AI模型融合成一个180亿参数的”弗兰肯斯坦式”混合模型。该模型在廉价GPU上运行,性能却超越了阿里巴巴的350亿参数模型,展示了开源社区在AI模型优化方面的创新能力。
-
阿里巴巴发布Qwen 3.6 Max预览版——迄今为止最强大的AI模型
阿里巴巴发布了Qwen 3.6-Max-Preview预览版,这是其迄今为止最强大的AI模型,在多项编码基准测试中表现优异。该模型标志着阿里巴巴从免费开源模式向商业化专有服务的转变,反映了中国AI实验室在全球AI竞争中的崛起趋势。
-
谷歌Gemma已具备Gemini特性,开发者将其打造成Claude Opus风格Gemopus模型
开发者Jackrong基于谷歌开源Gemma 4推出了Gemopus模型家族,将Claude Opus的推理风格融入美国本土AI模型中。该系列包含26B专家混合模型和4B边缘模型,可在个人设备上运行,提供前沿AI推理能力,同时避免了简单模仿Claude思维链的设计哲学。
-
MiniMax发布顶尖AI代理模型后悄然修改许可证条款
中国AI实验室MiniMax发布M2.7模型,性能媲美Claude Opus等顶尖模型,但随后悄然修改许可证限制商业使用。这一变化引发开发者社区争议,公司解释是为了防止恶意托管商提供降级版本损害声誉。这标志着中国AI公司从完全开源向更严格许可控制的转变。
-
Meta推出最强AI模型Muse Spark,但Gemini 3.1 Pro仍保持领先
Meta推出其最强大的AI模型Muse Spark,这是其超级智能实验室的首个产品。该模型具有原生多模态能力,在医疗推理和搜索方面表现优异,但在核心推理和编码方面仍落后于Gemini 3.1 Pro。这标志着Meta从开源转向封闭模型的战略转变。
-
忘记AGI吧——顶级AI模型在数学方面仍然挣扎
最新MATHVISTA基准测试显示,包括GPT-4V在内的12个顶级AI模型在视觉数学推理方面仍落后人类10.4个百分点。研究人员指出,实现AGI可能更依赖高质量训练数据而非模型规模,数据污染问题也影响评估准确性。
-
AI模型研究揭示:比特币成首选价值存储,稳定币主导支付场景
比特币政策研究所最新研究显示,36个前沿AI模型在9,072个货币场景测试中,比特币以48.3%的总体选择率成为最受欢迎货币工具。在长期价值存储场景中,比特币偏好高达79.1%,而稳定币在支付场景中以53.2%领先。研究揭示了AI模型对数字原生货币的压倒性偏好,90.8%的回答支持比特币和稳定币等数字资产。