AwesomeOPD

thinkwee

Awesome List for On-Policy Distillation

AI 简介

AwesomeOPD 是一个聚焦于策略内蒸馏（On-Policy Distillation, OPD）与策略内自蒸馏（OPSD）的开源资源整理清单，系统收录相关论文、代码库及技术实践。其核心涵盖白盒/黑盒OPD、OPSD、OPD-RL混合方法、推理增强型蒸馏、多模态与智能体场景下的OPD应用，并按教师来源、监督信号、采样消耗和流水线位置四维进行结构化标注。项目强调学生模型在训练中自主生成轨迹并接受实时反馈，适用于大语言模型高效训练、模型压缩、推理加速及具身智能体知识迁移等研究与工程场景。

awesome-list distillation large-language-model on-policy-distillation

在 GitHub 查看

726

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+34

综合评分48.17

默认分支main

AwesomeOPD

Star 增长

加入交流群