yifan123

flow_grpo

yifan123

[NeurIPS 2025] An official implementation of Flow-GRPO: Training Flow Matching Models via Online RL

AI 简介

Flow-GRPO是一个通过在线强化学习训练流匹配模型的官方实现。该项目利用Python语言开发,支持多种预训练模型和奖励机制,如CLIPScore作为奖励模型,并引入了GRPO-Guard等新特性来增强模型性能与安全性。此外,Flow-GRPO还提供了快速版本Flow-GRPO-Fast,在保证效果的同时大幅减少了训练步骤。此项目适用于需要高效且灵活地生成或编辑图像的应用场景,例如基于文本描述的图像合成、图像编辑等任务。通过提供的可视化界面和在线演示,用户可以直观地了解模型的工作原理及其在不同任务上的表现。

Python
MIT License
2.3k
Stars
161
Forks
22
Watchers
26
Issues

Star 增长

今日0
近 7 天+17
近 30 天+75
综合评分74.63
默认分支main