
reinforcement-learning
dennybritz
Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton's Book and David Silver's course.
AI 简介
该项目提供了强化学习算法的实现代码、练习及解决方案,旨在作为理论材料的学习辅助工具。核心功能包括动态规划、蒙特卡洛方法、时序差分学习、函数逼近以及深度Q学习等主流强化学习技术的实现,并使用Python 3编写,结合了OpenAI Gym环境和TensorFlow框架来支持神经网络的应用。适合于正在学习《强化学习:入门》(第二版)或David Silver的强化学习课程的学生与研究人员,通过实践加深对概念的理解和技术的掌握。
Jupyter Notebook
MIT License22k
Stars
6.1k
Forks
855
Watchers
97
Issues
Star 增长
今日+3
近 7 天+8
近 30 天+32
综合评分83.2
默认分支master