jzhang38

TinyLlama

jzhang38

The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.

AI 简介

TinyLlama项目旨在预训练一个基于3万亿个令牌的1.1B Llama模型。该项目采用了与Llama 2相同的架构和分词器,使得TinyLlama能够无缝集成到许多基于Llama构建的开源项目中。凭借其仅1.1B参数的紧凑设计,TinyLlama特别适合于对计算资源和内存占用有严格限制的应用场景。通过适当的优化,使用16块A100-40G GPU可以在大约90天内完成训练。此外,项目还提供了多个中间检查点以及详细的评估结果,以支持更广泛的实验和应用探索。

Python
Apache License 2.0
9k
Stars
621
Forks
1
Watchers
45
Issues

Star 增长

今日+6
近 7 天+11
近 30 天+31
综合评分84.98
默认分支main