文章摘要
【关 键 词】 AI图像、模型更新、功能对比、文本渲染、API优化
OpenAI于12月16日正式推出ChatGPT Images的重大更新,核心变化包括全新的图像生成与编辑体验,以及面向开发者的API模型GPT Image 1.5。此次升级聚焦三大能力:更精准的局部编辑功能,确保光照、构图和人物外观的一致性;更强的复杂指令遵循能力,能准确处理物体位置关系;显著提升的文本渲染效果,尤其在小字号密集排版场景下表现突出。产品形态上,ChatGPT内新增了独立的Images创作入口,并全面开放给普通用户。
开发者通过API可获得同款模型GPT Image 1.5,其定价策略显示图片处理成本较上一代降低约20%。尽管官方强调性能提升,但社区实测发现与竞品Nano Banana Pro存在明显差距:在写实照片质感测试中,Nano Banana Pro生成的图像更接近真实手机摄影效果,而GPT Image 1.5仍保留AI生成特征;生成速度方面,Nano Banana Pro快约2倍。值得注意的是,在OpenAI重点优化的文本排版场景中,双方表现接近——Nano Banana Pro同样能稳定呈现小字号文字与复杂版式。
两款产品的定位差异逐渐清晰:GPT Image 1.5擅长多轮迭代编辑和图文混排,适合需要反复修改的设计场景;Nano Banana Pro则在写实质感、生成速度和画幅控制等生产指标上更胜一筹。对于内容创作者而言,若需快速产出可直接投放的高质量素材,Nano Banana Pro仍是更优选择;而涉及复杂编辑流程的任务,GPT Image 1.5的连贯性优势更为突出。此次更新标志着OpenAI在图像生成可用性上的重要进步,但在专业级输出品质方面仍有提升空间。
原文和模型
【原文链接】 阅读原文 [ 1713字 | 7分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★☆☆☆☆




