与Banana Pro过过招,国产Libcom图像合成工作台开启Labubu漫游记

与Banana Pro过过招,国产Libcom图像合成工作台开启Labubu漫游记

 

文章摘要


【关 键 词】 AI生成图像编辑图像合成技术研究工具评测

2025年,AIGC技术持续升温,AI生成内容已广泛应用于社交头像、电商海报和影视分镜等领域。通用图像编辑大模型如Nano Banana和Qwen Edit展现出强大的功能,覆盖了广泛的图像编辑场景。其中,Nano Banana Pro能够将文字指令转化为高精度图像,精准呈现复杂场景。然而,这些大模型在细分领域仍存在不足,且处理简单任务时性价比不高。

上海交通大学牛力团队自2018年起专注于图像合成领域的研究,致力于解决物体插入(融图)中的技术难题。通过简单的剪切粘贴往往会导致合成图像出现边缘锯齿、光照不和谐、阴影缺失或透视不合理等问题。团队的目标是将不同图片元素有机融合,实现逼真的合成效果。经过多年积累,团队构建了10多个数据集,开发了30多个原创模型,并发表了25篇以上高质量论文。

2023年底,团队推出了Libcom工具箱,无需训练微调即可实现开箱即用的图像合成功能。2025年,团队进一步升级Libcom,推出了专注于图像合成的Libcom工作台,包含生成、检测、评估等12项功能。工作台分为6组功能:基础合成(alpha混合、泊松融合)、图像和谐化(颜色迁移、和谐化处理)、背景效果生成(阴影、倒影)、分析工具(不和谐区域检测、物体放置热力图)、打分工具(和谐度评分、放置合理性评分)以及高级合成(集成FLUX-Kontext和InsertAnything模型)。

通过Labubu角色的测试案例,对比了Libcom工作台与Nano Banana Pro的表现。在基础合成任务中,Libcom实现了无缝融合,而Banana Pro的结果则表现不稳定。在光照和谐化方面,Libcom的调整效果更为自然,Banana Pro则存在背景色调变化和前景过度处理的问题。艺术风格调整时,Libcom展现出更强烈的风格化能力,而Banana Pro相对保守。在阴影和倒影生成任务中,Banana Pro分别出现了方向错误和比例失真的问题。

测试结果表明,尽管Nano Banana Pro功能强大,但在图像合成的专业领域仍存在局限性。Libcom工作台凭借其针对性的功能设计和稳定的表现,为专业用户提供了可靠的工具选择。团队同时开放了学术和商务合作渠道,进一步推动图像合成技术的发展与应用。

原文和模型


【原文链接】 阅读原文 [ 1200字 | 5分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...