BlinkDL

RWKV-LM

BlinkDL

RWKV (pronounced RwaKuv) is an RNN with great LLM performance, which can also be directly trained like a GPT transformer (parallelizable). We are at RWKV-7 "Goose". So it's combining the best of RNN and transformer - great performance, linear time, constant space (no kv-cache), fast training, infinite ctx_len, and free sentence embedding.

AI 简介

RWKV是一个结合了RNN和Transformer优点的语言模型,能够实现与大型语言模型相当的性能,并且可以直接像GPT那样进行并行训练。其核心功能包括线性时间复杂度、常数空间占用(无需kv-cache)、快速训练以及无限上下文长度等特性,使得RWKV在保持高效的同时还具有良好的可扩展性。该模型特别适合需要高性能语言处理能力的应用场景,如大规模文本生成、多模态应用等。基于Python开发,RWKV利用PyTorch框架实现了上述功能,并通过Apache License 2.0开源发布,鼓励社区贡献与使用。

Python
Apache License 2.0
14.6k
Stars
1k
Forks
142
Watchers
124
Issues

Star 增长

今日0
近 7 天+12
近 30 天+46
综合评分79.61
默认分支main