1、Nano Banana 介绍
如果你最近被谷歌新发布的图像模型刷屏了,那你一定听过两个名字,一个是「Nano Banana」一个是「Gemini 2.5 Flash Image」
那一个模型为什么会有两个名字?
「Nano Banana」 是这个 AI 图片编辑与生成模型的非正式代号或别名,大多数是用户在社群、媒体、论坛中使用。
「Gemini 2.5 Flash Image」 是官方推出后正式使用的名称。
类似于张三是本名,但是你的朋友也可以叫你小张。现在因为太火了,AI studio 中已经改名「Nano Banana」
1.1 Nano Banana 到底是什么?
它是一个原生多模态模型,也就是说它可以同时理解文字和图片,而不是简单的把它们分开处理。
1.1.1 非原生分开处理的情况
这里面会有两个模型,一个是图像处理模型,只能看懂图像。一个是语言处理模型,只能看懂文字。
这个时候如果你有一张「小男孩正在踢足球的照片」

你给 AI 下个指令,让他把「小男孩正在踢足球的照片」变成「小男孩正在打篮球的照片」

可以发现图片生成出现了偏差,直接把脚下的足球变成了篮球,另外在足球场打篮球,场景也不对。在这个过程 AI 是怎么去执行的呢?
为了更好的阅读体验,来飞书看吧:
https://pk0zg2jkji.feishu.cn/docx/EEsqdWN5qogMiaxXRTmcD17on5i
Comments on "一篇文章帮你系统了解 Nano Banana" :