Flow-OPD

CostaliyA

Official Repo of "Flow-OPD: On-Policy Distillation for Flow Matching Models"

AI 简介

Flow-OPD 是一个将在线策略蒸馏集成到流匹配模型中的项目。它通过使用密集的、基于轨迹的多教师向量场监督来替代稀疏的标量奖励，从而优化了流匹配过程。该项目采用 Python 语言编写，并在 SD-3.5-Medium 上实现了相较于基础 GRPO 模型平均提升 18 个百分点的效果，同时在 OCR 和 DeQA 任务上也超越了单个教师模型的表现。Flow-OPD 适合需要高精度和高效训练的场景，如生成对抗网络（GANs）的改进、自然语言处理中的文本生成以及图像识别等应用领域。

Python

MIT License

在 GitHub 查看官方网站

227

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天+5

近 30 天+114

综合评分53.93

默认分支main