CVPR 2026|告别「一属性一训练」,美图&北交大提出统一属性编辑框架 All-in-One Slider
文章摘要
【关 键 词】 扩散模型、属性操纵、语义解耦、影像生成、人脸编辑
生成式AI在影像内容生产中面临语义高度纠缠的问题,导致在调整人物属性时容易破坏整体结构或改变其他特征。为实现对生成图像的可解释、细粒度及连续属性操纵,美图影像研究院联合北京交通大学提出了基于扩散模型的All-in-One Slider新框架。该方案实现了对人脸属性的连续精细化控制,并最大限度地保持了图像整体结构及面部细节信息。
传统方法多采用一对一模式训练独立滑块,存在参数冗余和扩展性差的问题。All-in-One Slider创新性地引入轻量级属性稀疏自编码器,将复杂的属性操纵分解为属性解耦训练和滑块属性操纵两个阶段。在解耦训练阶段,通过Top-k激活机制强制实现稀疏化,并结合辅助损失函数进行残差修复,从源头上实现不同属性间的彻底解耦。在操纵阶段,该模块化身通用操纵器,无需针对新属性进行额外微调,即可在统一潜空间中精准定位语义方向,并通过调整缩放因子实现图像属性的平滑连续控制。
大量实验结果表明,该框架在属性编辑准确性、身份一致性保持及可扩展性等维度相较既往方案有显著提升。得益于稀疏空间的解耦特性,模型在大幅度改变目标属性的同时,能够完美保留原图人物的身份特征信息与背景细节。此外,通过对已学习到的属性方向进行重组,该框架实现了对多属性组合及未见属性的零样本泛化操纵,并支持集成至扩散模型的逆向映射框架中,有效拓宽了在各种现实场景中的落地应用。
随着AI影像进入高速发展期,用户需求从单纯追求视觉效果转向关注情绪表达与自然真实,背后的复杂人类语义对技术提出了更高要求。AI影像的发展需要由功能叠加走向理解驱动,生成模型不仅要解决从无到有的生成问题,更要精准理解用户的真实意图。这种趋势正持续推动生成式AI与影像工具的深度融合,促使技术在垂直场景的深度应用中实现真正可用,满足多元化的人像精细化编辑需求。
原文和模型
【原文链接】 阅读原文 [ 2194字 | 9分钟 ]
【原文作者】 AI科技评论
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★



