
RustGPT
tekaratzas
An transformer based LLM. Written completely in Rust
AI 简介
RustGPT是一个完全用Rust编写的基于Transformer架构的大规模语言模型。该项目不依赖任何外部机器学习框架,仅使用`ndarray`进行矩阵运算,实现了从预训练到指令微调的全流程,包括交互式聊天模式和全反向传播算法。其模块化设计使得代码结构清晰,易于理解和扩展。尽管它目前还不是一个生产级别的解决方案,但非常适合于那些希望深入了解语言模型内部机制的研究者或开发者,特别是对Rust编程感兴趣的用户。通过这个项目,你可以学习到如何从零开始构建一个复杂的深度学习系统。
Rust
MIT License3.1k
Stars
264
Forks
34
Watchers
5
Issues
Star 增长
今日+4
近 7 天+11
近 30 天+16
综合评分74.37
默认分支main