PaLM-rlhf-pytorch

lucidrains

Implementation of RLHF (Reinforcement Learning with Human Feedback) on top of the PaLM architecture. Basically ChatGPT but with PaLM

AI 简介

这是一个基于PaLM架构实现RLHF（基于人类反馈的强化学习）训练流程的开源PyTorch框架，旨在复现类似ChatGPT的对齐范式。核心包含奖励模型训练、PPO优化器集成及与PaLM解码器的适配接口，支持Flash Attention等高效注意力优化，并预留检索增强（RETRO风格）扩展能力。项目提供可复现的训练管道代码，但不含预训练权重或推理模型，适用于研究者和工程师在自有数据与算力条件下开展大语言模型对齐实验。

Python

MIT License

artificial-intelligence attention-mechanisms deep-learning human-feedback reinforcement-learning transformers

在 GitHub 查看

7.9k

Stars

674

Forks

133

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+4

综合评分64.89

默认分支main

PaLM-rlhf-pytorch

Star 增长

加入交流群