谷歌发布全球第一图像模型：免费使用、支持中文，爆火香蕉图就靠它

1,575 0 0

文章摘要

谷歌发布的最新图像模型Gemini 2.5 Flash Image引发关注，它具备强大的图像生成、编辑和融合能力，且免费支持中文使用，使用地址为https://gemini.google.com/app。

性能领先：根据谷歌公布的数据，Gemini 2.5 Flash Image在多项测试中领先于OpenAI的GPT image 1最高版本、黑森林实验室的FuUXI Kontent MAX版以及阿里巴巴最新开源的image Edit，成为目前最强的图像模型。

功能展示：在图像编辑方面，以著名足球员卡洛斯的图片为例，它能精准按照提示改变特定区域，如将头部换成香蕉人、把足球换成钻石等，且能保持其他区域不变。在转换吉卜力风格时虽有小意外，但抠图效果出色，还可通过多轮对话调整至满意。图像融合功能也十分惊艳，能让小男孩开心笑、拿玩具，还能实现两位小朋友手牵手的融合效果，远超传统PS操作。

图像生成：该模型能根据文本提示生成不同场景的图片，如2077年的深海科研基地、神秘的热带雨林、宁静的沙漠等，虽生成效果没有编辑功能那么惊艳，但在文本语义还原、构图、光线等方面表现不错，属于top级水平。

此外，国外爆火的Nano Banana生成的图片就使用了该模型，谷歌CEO相关推文也体现了香蕉图的热度。网友对其表示肯定，认为精准的控制能力与细腻的输出效果才是提升用户体验的关键，称赞这项创新为创意打开了大门，对谷歌人工智能团队的成果表示祝贺。