实测GPT Image 1.5，拼尽全力还是没能打败Banana。

561 0 0

文章摘要

OpenAI近期发布了GPT Image 1.5图像生成模型，与Google的Banana Pro展开直接竞争。通过对多组测试案例的对比分析，发现两者在信息准确性、真实质感、精准编辑和世界知识等方面各有优劣。

在信息准确性方面，Banana Pro表现更为稳定，尤其在中文文本生成任务中，GPT Image 1.5出现了明显的错误，如重复数字、文字排版混乱等问题。例如，生成月历时，GPT未能正确停止在28日，而Banana Pro则完全符合要求。此外，在生成苏绣工艺解说图时，GPT的内容组织较为混乱，而Banana Pro的展示更为清晰。

真实质感方面，Banana Pro生成的图像更接近自然光效和真实场景，而GPT的图片饱和度和对比度较高，略显“AI感”。例如，在生成酒吧场景的肖像照时，Banana Pro的光影处理更为细腻，而GPT的成像风格偏向夸张。

在精准编辑任务中，Banana Pro在人物替换、服装修改等细节上表现更优。例如，将发布会中的奥特曼替换为染夏时，Banana Pro保持了正确的透视关系，而GPT的人物比例出现了偏差。此外，跨画风替换天气的任务中，Banana Pro的完成度更高，而GPT错误地改变了整体色调。

世界知识测试显示，两者各有胜负。GPT Image 1.5在海贼王角色排名中出现了明显的知识错误（如混淆“赤犬”和“库赞”），而Banana Pro的排名更为准确。但在生成七根手指的图片时，Banana Pro完全失败，而GPT部分正确。

总体来看，Banana Pro在一致性、细节处理和中文任务上更具优势，而GPT Image 1.5的构图和风格化表现略胜一筹。然而，OpenAI的迭代速度明显落后于Google，后者在短短几个月内从Gemini 2.5进化至Banana Pro，展现了强大的技术推进能力。当前，Google在AI图像生成领域占据领先地位，OpenAI仍需进一步优化模型以缩小差距。