
HY-SOAR
Tencent-Hunyuan
HY-SOAR:Self-Correction for Optimal Alignment and Refinement in Diffusion Models
AI 简介
HY-SOAR 是一种用于扩散模型的无奖励后训练方法,旨在纠正生成过程中的轨迹误差。其核心功能包括在生成过程中实时自我修正,无需依赖奖励模型、偏好标签或负样本。通过引入一个密集且无奖励的训练信号,HY-SOAR 能够监督去噪器,并纠正模型自身预测产生的状态误差。这种方法特别适用于需要高精度和稳定性的图像生成任务,如高质量图像合成和编辑等场景。
Python
Other629
Stars
64
Forks
44
Watchers
0
Issues
Star 增长
今日0
近 7 天+1
近 30 天+165
综合评分59.94
默认分支main