标签:标量反馈

无需构造偏好对:TGO用标量反馈对齐视觉生成模型|ICML’26

生成模型的偏好对齐正在从传统的成对比较转向利用标量反馈的新阶段。过往主流算法依赖成对偏好数据进行训练,虽结构优雅且计算高效,但将真实场景中连续的多...