CostaliyA

Flow-OPD

CostaliyA

Official Repo of "Flow-OPD: On-Policy Distillation for Flow Matching Models"

AI 简介

Flow-OPD 是一个将在线策略蒸馏集成到流匹配模型中的项目。它通过使用密集的、基于轨迹的多教师向量场监督来替代稀疏的标量奖励,从而优化了流匹配过程。该项目采用 Python 语言编写,并在 SD-3.5-Medium 上实现了相较于基础 GRPO 模型平均提升 18 个百分点的效果,同时在 OCR 和 DeQA 任务上也超越了单个教师模型的表现。Flow-OPD 适合需要高精度和高效训练的场景,如生成对抗网络(GANs)的改进、自然语言处理中的文本生成以及图像识别等应用领域。

Python
MIT License
227
Stars
2
Forks
7
Watchers
2
Issues

Star 增长

今日0
近 7 天+5
近 30 天+114
综合评分53.93
默认分支main