reinforcement-learning

dennybritz

Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.

AI 简介

这是一个面向强化学习初学者的教学实践项目，提供经典算法的可运行实现、配套练习与详细解析。项目覆盖马尔可夫决策过程、动态规划、蒙特卡洛方法、时序差分学习、函数逼近、深度Q网络（DQN）及策略梯度等核心内容，所有代码基于Python 3，依托OpenAI Gym环境和TensorFlow框架实现。每个模块均对应Sutton《强化学习导论》与David Silver课程章节，包含学习目标、概念摘要与参考文献，适合高校教学辅助、自学训练及算法原理验证场景使用。

Jupyter Notebook

MIT License

在 GitHub 查看官方网站

22.1k

Stars

6.1k

Forks

855

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+14

综合评分71.4

默认分支master

reinforcement-learning

Star 增长

加入交流群