
diamond
eloialonso
DIAMOND (DIffusion As a Model Of eNvironment Dreams) is a reinforcement learning agent trained in a diffusion world model. NeurIPS 2024 Spotlight.
AI 简介
DIAMOND 是一个基于扩散模型训练的强化学习代理。其核心功能是通过在扩散世界模型中训练,使得代理能够处理复杂的环境任务,如Atari游戏和CS:GO中的视觉细节。项目使用Python编写,利用了深度学习、强化学习以及扩散模型等先进技术。它适合用于需要高精度模拟复杂动态环境的研究场景,比如游戏AI开发或任何涉及序列决策与环境交互的人工智能研究领域。此外,DIAMOND还提供了预训练模型供快速上手体验,并且支持用户自定义训练配置以适应不同需求。
Python
MIT License2.1k
Stars
157
Forks
21
Watchers
6
Issues
Star 增长
今日+1
近 7 天+7
近 30 天+19
综合评分66
默认分支main