huggingface

alignment-handbook

huggingface

Robust recipes to align language models with human and AI preferences

AI 简介

huggingface/alignment-handbook 是一个提供稳健方法来继续预训练并将语言模型与人类和AI偏好对齐的项目。它通过强化学习从人类反馈(RLHF)等技术,增强语言模型在遵循指令、帮助性和安全性方面的表现。该项目使用Python编写,基于transformers库,并提供了详细的训练食谱,涵盖了从数据收集到模型微调的整个流程。适合需要定制化聊天机器人或希望提高现有语言模型性能的研究人员和开发者使用。

Python
Apache License 2.0
5.6k
Stars
492
Forks
103
Watchers
92
Issues

Star 增长

今日+2
近 7 天+5
近 30 天+14
综合评分71.98
默认分支main