谷歌发布全球第一图像模型:免费使用、支持中文,爆火香蕉图就靠它

AIGC动态15小时前发布 AIGCOPEN
113 0 0
谷歌发布全球第一图像模型:免费使用、支持中文,爆火香蕉图就靠它

 

文章摘要


【关 键 词】 Gemini2.5图像模型性能领先图像编辑图像生成

谷歌发布的最新图像模型Gemini 2.5 Flash Image引发关注,它具备强大的图像生成、编辑和融合能力,且免费支持中文使用,使用地址为https://gemini.google.com/app。

性能领先:根据谷歌公布的数据,Gemini 2.5 Flash Image在多项测试中领先于OpenAI的GPT image 1最高版本、黑森林实验室的FuUXI Kontent MAX版以及阿里巴巴最新开源的image Edit,成为目前最强的图像模型。

功能展示:在图像编辑方面,以著名足球员卡洛斯的图片为例,它能精准按照提示改变特定区域,如将头部换成香蕉人、把足球换成钻石等,且能保持其他区域不变。在转换吉卜力风格时虽有小意外,但抠图效果出色,还可通过多轮对话调整至满意。图像融合功能也十分惊艳,能让小男孩开心笑、拿玩具,还能实现两位小朋友手牵手的融合效果,远超传统PS操作。

图像生成:该模型能根据文本提示生成不同场景的图片,如2077年的深海科研基地、神秘的热带雨林、宁静的沙漠等,虽生成效果没有编辑功能那么惊艳,但在文本语义还原、构图、光线等方面表现不错,属于top级水平。

此外,国外爆火的Nano Banana生成的图片就使用了该模型,谷歌CEO相关推文也体现了香蕉图的热度。网友对其表示肯定,认为精准的控制能力与细腻的输出效果才是提升用户体验的关键,称赞这项创新为创意打开了大门,对谷歌人工智能团队的成果表示祝贺。

原文和模型


【原文链接】 阅读原文 [ 1681字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...