
baselines
openai
OpenAI Baselines: high-quality implementations of reinforcement learning algorithms
AI 简介
OpenAI Baselines 是一系列高质量的强化学习算法实现。该项目提供了DQN及其变体等算法的实现,这些算法在性能上与已发表论文中的结果相当,旨在为研究者提供一个可靠的基础来复现、改进现有算法,并在此基础上探索新的想法。项目支持Python 3.5及以上版本,依赖TensorFlow(1.4至1.14版本),同时也兼容TensorFlow 2.0(需切换到tf2分支)。对于需要构建或比较新方法的研究场景来说,Baselines是一个非常合适的工具。此外,部分示例使用了MuJoCo物理模拟器,适合于进行涉及复杂物理交互环境下的强化学习研究。
Python
MIT License16.7k
Stars
4.9k
Forks
627
Watchers
413
Issues
Star 增长
今日+2
近 7 天+9
近 30 天+25
综合评分61
默认分支master