
文章摘要
【关 键 词】 AI绘图、生图一致、Nano模型、LMArena、测评优势
Nano Banana是一款神秘的AI绘图新模型,虽未正式推出,但其实测效果令人惊叹。
生图一致性表现卓越:以作者自身照片生成视频封面底图为例,作者输入特定提示词后,Nano Banana几乎完全保留了面部特征和表情,人物一致性堪称完美。与之对比,GPT – 4o、Flux Kontext和即梦等模型在人物一致性上表现不佳,Nano Banana完胜。在实际应用中,使用Nano Banana做封面,只需生成一两次就能满足“长得像本人”的要求。
模型背景与使用方式:Nano Banana目前仅出现在LMArena上,这是全球主流的大模型竞技场,采用模型匿名对战、用户投票的评测形式。它可能是谷歌即将推出的新模型,通过在LMArena盲测来评估实力。使用时,登录LMArena网站,选择battle模式,输入提示词和参考图,系统会随机选择两个模型生成图片,用户选择效果更好的图片后,系统才会揭晓模型名称。
多维度测评优势明显:作者对Nano Banana、flux、gpt4o、即梦等模型进行多方面测试。在单个主体一致性、多主体测试、背景替换能力、主体一致性 + 背景替换、动作迁移能力、人物情绪表现、细节修改能力和风格转换等测试中,Nano Banana大多表现最佳。如在单个主体一致性测试中,它能保持主体妆容、服饰、头饰与原图一致,并完成提示词要求;在风格转换测试中,无论是赛博朋克、梵高还是水墨画风格,其完成度和人物一致性都更胜一筹。
总体而言,从生图效果看,Nano Banana优势显著,seedream和flux需多次生成,而gpt4o表现较差。作者建议用户尝试使用Nano Banana,还给出了用其制作真人视频封面的方法。目前,Nano Banana堪称一致性之王,其未来表现值得期待。
原文和模型
【原文链接】 阅读原文 [ 2858字 | 12分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★