谷歌最近以惊人的速度发布AI软件。仅在过去一周左右,我们就看到了Gemini 3.1、Lyria和Pali,后者附带了一个照片拍摄功能,结果证明深受大众欢迎。而现在,可以说是去年最大的图像生成热门的后续产品已经到来。
周四发布的Nano Banana 2″将Gemini Flash的高速智能引入视觉生成,使快速编辑和迭代成为可能,”谷歌在一篇官方博客文章中表示,并补充说”它使曾经专属的Pro功能对更广泛的受众变得可及。”
以下是快速分解。最初的Nano Banana实际上名为Gemini 2.5 Flash Image,基本上就是:一个基于Gemini 2.5 Flash的图像生成器。然后是Nano Banana Pro,即Gemini 3 Pro Image,它在去年11月发布时成为AI图像编辑的黄金标准。
Nano Banana 2在技术上是Gemini 3.1 Flash Image——所以它不是Pro的直接续作,而更像是原始版本的显著升级版,现在运行在更新的Gemini 3 Flash骨干上。令人困惑?是的。
这里的宣传很简单:采用使Nano Banana Pro特别的一切,并使其以Flash速度运行。
新的Nano Banana 2今天在谷歌的生态系统中推出。在Gemini应用中,它取代Nano Banana Pro成为Fast、Thinking和Pro模型的默认选项。Google AI Pro和Ultra订阅者仍然可以通过三点菜单重新生成来访问Nano Banana Pro以执行专门任务。

Nano Banana 2的新功能
最大的亮点是世界知识。Nano Banana 2可以在图像生成过程中从实时网络搜索中提取信息,这意味着它可以准确地渲染特定主题。徽标、地标、近期事件、品牌标识——它知道事物的样子,因为它可以查找它们,而不仅仅是从训练数据中猜测。
文本渲染也得到了重大升级。您现在可以在图像中生成准确、易读的文本,无论是通过提示拼写出来,还是让模型根据上下文决定写什么。它还处理图像内翻译,因此您可以在不从头重建视觉的情况下跨多种语言本地化广告活动。
主题一致性也正在进入新领域。根据谷歌的说法,该模型可以在最多五个主题中保持角色相似性,并在单个工作流程中保持最多14个对象的视觉保真度。这对于任何构建叙事、故事板或一致的品牌资产的人来说都是一件大事。
在生产方面,您可以从512px一直到4K,并原生支持多种宽高比。指令遵循也比以前的Flash模型更严格,在实践中意味着更少的提示只是大致完成您的请求,而更多的提示实际上完全按照您的请求执行。
推理现在也是可配置的。开发人员可以将思维级别从最小(默认)一直设置到高或动态,让模型在提交渲染之前通过复杂的提示进行推理。这种速度和可选深思熟虑的结合是许多质量提升的来源。

测试模型
速度声明是真实的。我们要求Nano Banana 2生成一个完整的比特币生态系统时间线,包括研究和最终艺术作品。整个过程花费的时间与Nano Banana Pro仅完成比特币时间线所需的时间大致相同。当我们随后跟进一个以太坊时间线提示时,它几乎不占用额外时间。对于任何运行迭代管道或大规模构建的人来说,这是一个有意义的差距。
世界知识能力真正改变了输出的感觉。当我们提示历史加密货币时间线时,模型搜索了多个来源,选择了最相关的事件,并围绕它们构建了艺术。它不是通用的。模型做出了编辑决策。我们发现的唯一真正缺陷是一个部分结束和另一个部分开始之间缺少视觉链接。其他一切都保持一致。相比之下,Nano Banana Pro产生了一些更通用的艺术性内容,并且没有明显努力去获取或优先处理事件。
例如,这是Nano Banana 2在提示”创建比特币历史的时间线,突出显示从创建到今天的最重要事件。宽屏,儿童绘画风格”时使用思维生成的内容。

作为对比,这是使用Nano Banana Pro生成的相同内容:

角色一致性和文本处理是我们测试结果中最令人印象深刻的部分。我们要求模型生成一个杂志封面,每一行文本都准确且定义清晰。没有乱码字符,没有漂移的排版。

Nano Banana Pro在这方面也很强大,但它会产生更多的故障,并且其杂志封面输出具有3D渲染质量,显得合成。

Nano Banana 2的结果看起来像照片一样真实。当通过自己的推理生成文本时,总体上显示更少的乱码字符,而不仅仅是当明确告知写什么时。
也就是说,模型有明显的內容上限。我们要求Nano Banana 2编辑一张真实照片并将服装改为内衣。经过长时间的推理周期后,它拒绝了。这是可以预料的,如果不是因为它拒绝编辑女性照片,但不拒绝编辑男性照片的话。

要求更换泳衣效果很好。审查水平大致相当于Nano Banana Pro,这意味着任何推向明确领域或在暗示性上下文中操纵真实人物的内容都将被阻止。这比听起来更重要,我们稍后会解释原因。
Seedream 5:Nano Banana 2面临竞争
在2026年2月下旬发布旗舰图像模型的问题是:字节跳动在同一周发布了Seedream 5。
Seedream在过去一年中已成为社区的最爱,原因充分。它灵活,成本效益高——通过API每张图像约0.035美元,大约是谷歌价格的三分之一——而且其内容审核比谷歌的宽松得多。最后一点为它赢得了需要更多空间处理真实人物或推动视觉边界的创作者的忠实追随者。
Seedream 5将实时网络搜索引入其生成管道,改进推理,更强的参考一致性,并支持在单个多轮编辑工作流程中最多14个参考图像。它在几秒钟内生成2K和4K图像。它还可以本地运行,这是谷歌不允许的,并且可通过字节跳动的CapCut和剪映以及标准API获得。
简而言之,谷歌和字节跳动在同一周发布了基于网络搜索、推理增强的图像模型。这告诉您整个类别的发展方向。
本网站所有区块链相关数据与资料仅供用户学习及研究之用,不构成任何投资建议。转载请注明出处:https://www.lianxinshe666.com/2026/02/27/%e8%b0%b7%e6%ad%8c%e5%8f%91%e5%b8%83nano-banana-2%ef%bc%9aai%e5%9b%be%e5%83%8f%e7%94%9f%e6%88%90%e7%9a%84%e6%96%b0%e7%8e%8b%e8%80%85%ef%bc%9f/