
文章摘要
【关 键 词】 Gemini2.5、图像模型、性能领先、图像编辑、图像生成
谷歌发布的最新图像模型Gemini 2.5 Flash Image引发关注,它具备强大的图像生成、编辑和融合能力,且免费支持中文使用,使用地址为https://gemini.google.com/app。
性能领先:根据谷歌公布的数据,Gemini 2.5 Flash Image在多项测试中领先于OpenAI的GPT image 1最高版本、黑森林实验室的FuUXI Kontent MAX版以及阿里巴巴最新开源的image Edit,成为目前最强的图像模型。
功能展示:在图像编辑方面,以著名足球员卡洛斯的图片为例,它能精准按照提示改变特定区域,如将头部换成香蕉人、把足球换成钻石等,且能保持其他区域不变。在转换吉卜力风格时虽有小意外,但抠图效果出色,还可通过多轮对话调整至满意。图像融合功能也十分惊艳,能让小男孩开心笑、拿玩具,还能实现两位小朋友手牵手的融合效果,远超传统PS操作。
图像生成:该模型能根据文本提示生成不同场景的图片,如2077年的深海科研基地、神秘的热带雨林、宁静的沙漠等,虽生成效果没有编辑功能那么惊艳,但在文本语义还原、构图、光线等方面表现不错,属于top级水平。
此外,国外爆火的Nano Banana生成的图片就使用了该模型,谷歌CEO相关推文也体现了香蕉图的热度。网友对其表示肯定,认为精准的控制能力与细腻的输出效果才是提升用户体验的关键,称赞这项创新为创意打开了大门,对谷歌人工智能团队的成果表示祝贺。
原文和模型
【原文链接】 阅读原文 [ 1681字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★☆☆