
dreamerv3
danijar
Mastering Diverse Domains through World Models
AI 简介
DreamerV3是一个基于世界模型的通用强化学习算法,能够以固定超参数掌握多种应用。该项目利用JAX框架实现了一个可扩展的世界模型,该模型从经验中学习,并通过想象轨迹训练演员-评论家策略,从而在不需过多调参的情况下超越专门化方法。其核心技术包括将感官输入编码为分类表示,并根据动作预测未来状态与奖励。DreamerV3适用于需要较少专家知识和计算资源就能部署强化学习方案的各种场景,如游戏AI、机器人控制等复杂任务领域。此外,项目还展示了良好的扩展性,使用更大规模模型时不仅最终性能提升,数据效率也得到改善。
Python
MIT License3.4k
Stars
553
Forks
35
Watchers
37
Issues
Star 增长
今日+7
近 7 天+50
近 30 天+183
综合评分104.23
默认分支main