
Parallax
Yifei-Zuo
Official repository for Parallax (Parameterized Local Linear Attention)
AI 简介
Parallax是一个实现参数化局部线性注意力机制的项目,旨在改进传统的Softmax Attention。其核心功能包括通过优化的局部线性注意力算法提供更高效的计算性能,并且与现有的Softmax Attention共享相同的计算结构,支持KV缓存用于解码过程。技术上,Parallax利用了如滑动窗口和块稀疏性等优化策略来进一步提升效率。该项目特别适合需要在保持模型准确性的前提下提高处理速度的应用场景,比如大规模文本生成、机器翻译等自然语言处理任务中。代码基于Python编写,并针对NVIDIA Hopper GPU进行了优化。
Python
MIT License60
Stars
5
Forks
29
Watchers
1
Issues
Star 增长
今日+1
近 7 天+6
近 30 天+27
综合评分50.03
默认分支main