
autoresearch
karpathy
AI agents running research on single-GPU nanochat training automatically
AI 简介
autoresearch项目旨在通过AI代理自动进行基于单GPU的小型聊天模型训练研究。其核心功能是让AI代理在夜间自主实验,包括修改代码、训练5分钟、评估结果并决定是否保留更改,以此循环迭代以优化模型。技术特点在于使用Python编写,并且仅需少量关键文件即可运行,其中`train.py`由AI代理编辑迭代,而`program.md`则由人类设定指导原则。此项目适用于希望探索AI自我改进能力的研究者或开发者,在有限计算资源下追求模型性能提升的场景中尤为适用。
Python
85.6k
Stars
12.4k
Forks
664
Watchers
53
Issues
Star 增长
今日+166
近 7 天+1116
近 30 天+5879
综合评分117
默认分支master