实测GPT Image 1.5,拼尽全力还是没能打败Banana。

AIGC动态12小时前发布 admin
117 0 0
实测GPT Image 1.5,拼尽全力还是没能打败Banana。

 

文章摘要


【关 键 词】 AI模型图像生成技术对比GoogleOpenAI

OpenAI近期发布了GPT Image 1.5图像生成模型,与Google的Banana Pro展开直接竞争。通过对多组测试案例的对比分析,发现两者在信息准确性、真实质感、精准编辑和世界知识等方面各有优劣。

信息准确性方面,Banana Pro表现更为稳定,尤其在中文文本生成任务中,GPT Image 1.5出现了明显的错误,如重复数字、文字排版混乱等问题。例如,生成月历时,GPT未能正确停止在28日,而Banana Pro则完全符合要求。此外,在生成苏绣工艺解说图时,GPT的内容组织较为混乱,而Banana Pro的展示更为清晰。

真实质感方面,Banana Pro生成的图像更接近自然光效和真实场景,而GPT的图片饱和度和对比度较高,略显“AI感”。例如,在生成酒吧场景的肖像照时,Banana Pro的光影处理更为细腻,而GPT的成像风格偏向夸张。

精准编辑任务中,Banana Pro在人物替换、服装修改等细节上表现更优。例如,将发布会中的奥特曼替换为染夏时,Banana Pro保持了正确的透视关系,而GPT的人物比例出现了偏差。此外,跨画风替换天气的任务中,Banana Pro的完成度更高,而GPT错误地改变了整体色调。

世界知识测试显示,两者各有胜负。GPT Image 1.5在海贼王角色排名中出现了明显的知识错误(如混淆“赤犬”和“库赞”),而Banana Pro的排名更为准确。但在生成七根手指的图片时,Banana Pro完全失败,而GPT部分正确。

总体来看,Banana Pro在一致性、细节处理和中文任务上更具优势,而GPT Image 1.5的构图和风格化表现略胜一筹。然而,OpenAI的迭代速度明显落后于Google,后者在短短几个月内从Gemini 2.5进化至Banana Pro,展现了强大的技术推进能力。当前,Google在AI图像生成领域占据领先地位,OpenAI仍需进一步优化模型以缩小差距。

原文和模型


【原文链接】 阅读原文 [ 3041字 | 13分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...