
Drift
ant-research
Drift: DLM Reinforcement Learning Training Framework
AI 简介
Drift是一个用于扩散语言模型的强化学习训练框架。它支持多种模型,包括LLaDA和Dream系列,并且提供了灵活的掩码策略,如顺序掩码、随机掩码等,以适应不同的任务需求。该框架通过块级并行解码与动态置信度阈值加速了生成过程,同时内置了数学、代码、数独和倒计时等多种RLVR任务的奖励函数。适用于需要高效训练扩散语言模型的研究者或开发者,在处理复杂文本生成任务时尤其有用。项目采用Python编写,遵循Apache License 2.0许可协议。
Python
Apache License 2.0142
Stars
24
Forks
8
Watchers
1
Issues
Star 增长
今日+5
近 7 天+42
近 30 天+101
综合评分84.19
默认分支main