meta-pytorch

gpt-fast

meta-pytorch

Simple and efficient pytorch-native transformer text generation in <1000 LOC of python.

AI 简介

gpt-fast 是一个基于 PyTorch 的高效文本生成项目,旨在通过简洁的代码实现高性能的Transformer模型。其核心功能包括极低延迟、量化支持(int8/int4)、推测解码以及张量并行化等技术特点,并且仅依赖PyTorch和sentencepiece两个库。该项目特别适合需要快速原型设计或性能优化的研究人员及开发者使用,在单机环境下即可获得接近最优的文本生成速度,尤其对NVIDIA与AMD GPU提供了良好支持。此外,它还展示了如何利用原生PyTorch达到高性能,鼓励用户根据需求进行自定义扩展。

Python
BSD 3-Clause "New" or "Revised" License
6.2k
Stars
573
Forks
59
Watchers
76
Issues

Star 增长

今日+2
近 7 天+2
近 30 天+15
综合评分70.78
默认分支main