CVPR 2026｜告别「一属性一训练」，美图&北交大提出统一属性编辑框架 All-in-One Slider

26 0 0

文章摘要

生成式AI在影像内容生产中面临语义高度纠缠的问题，导致在调整人物属性时容易破坏整体结构或改变其他特征。为实现对生成图像的可解释、细粒度及连续属性操纵，美图影像研究院联合北京交通大学提出了基于扩散模型的All-in-One Slider新框架。该方案实现了对人脸属性的连续精细化控制，并最大限度地保持了图像整体结构及面部细节信息。

传统方法多采用一对一模式训练独立滑块，存在参数冗余和扩展性差的问题。All-in-One Slider创新性地引入轻量级属性稀疏自编码器，将复杂的属性操纵分解为属性解耦训练和滑块属性操纵两个阶段。在解耦训练阶段，通过Top-k激活机制强制实现稀疏化，并结合辅助损失函数进行残差修复，从源头上实现不同属性间的彻底解耦。在操纵阶段，该模块化身通用操纵器，无需针对新属性进行额外微调，即可在统一潜空间中精准定位语义方向，并通过调整缩放因子实现图像属性的平滑连续控制。

大量实验结果表明，该框架在属性编辑准确性、身份一致性保持及可扩展性等维度相较既往方案有显著提升。得益于稀疏空间的解耦特性，模型在大幅度改变目标属性的同时，能够完美保留原图人物的身份特征信息与背景细节。此外，通过对已学习到的属性方向进行重组，该框架实现了对多属性组合及未见属性的零样本泛化操纵，并支持集成至扩散模型的逆向映射框架中，有效拓宽了在各种现实场景中的落地应用。

随着AI影像进入高速发展期，用户需求从单纯追求视觉效果转向关注情绪表达与自然真实，背后的复杂人类语义对技术提出了更高要求。AI影像的发展需要由功能叠加走向理解驱动，生成模型不仅要解决从无到有的生成问题，更要精准理解用户的真实意图。这种趋势正持续推动生成式AI与影像工具的深度融合，促使技术在垂直场景的深度应用中实现真正可用，满足多元化的人像精细化编辑需求。