断层领先!Google发布图像生成和编辑大模型Gemini 2.5 Flash Image Preview,火爆网络的Nano Banana背后真正的模型发布!
就在刚才,Google宣布发布最新的图像生成和编辑大模型Gemini 2.5 Flash Image Preview。该模型就是最近火爆网络的Nana Banana背后真正的模型。该模型在图片生成和编辑方面目前是断层领先,效果非常好。

Gemini 2.5 Flash Image Preview是一次算法大升级
2025年4月底,Google发布了Gemini的图像编辑功能,但是彼时这个模型表现并不惊艳,主要是图像编辑功能很难保持图像原有对象的一致性。例如,给图像人物换一个发型,可能会导致人物的脸变了。
Google认为当编辑自己或熟悉人物的照片时,细微的瑕疵都至关重要。"相似却不够传神"的呈现总会令人感到失真。因此,Google训练了这个新模型,即Gemini 2.5 Flash Image Preview。最新升级的算法特别注重让亲友甚至宠物的照片始终保持本真特质,无论是尝试60年代的蜂窝发型,还是给吉娃娃穿上芭蕾舞裙,照片中的动物或者人物看起来都没有变化,是同一个。
Gemini 2.5 Flash Image Preview模型支持文本和图片作为输入,可以输出文本和图片,最高支持32K的输入和32K的输出。训练的知识截止到2024年6月份。
Gemini 2.5 Flash Image Preview能力断层领先
在Google正式宣布Gemini 2.5 Flash Image Preview之前,网络上有一个非常火爆的图像生成和编辑大模型,就是Nano Banana,该模型最早在LM Arena上出现,没有任何一家公司宣称拥有该模型,但是大家逐渐发现它的效果远超当前所有模型(关于Nano Banana可以参考此前DataLearnerAI的博客:神秘的图片生成和编辑大模型Nano Banana是什么?背后是Google吗?什么时候发布?能否颠覆Adobe)。




