
AutoGPTQ
AutoGPTQ
An easy-to-use LLMs quantization package with user-friendly apis, based on GPTQ algorithm.
AI 简介
AutoGPTQ 是一个基于 GPTQ 算法(仅权重量化)的易于使用的大型语言模型量化工具包,提供了用户友好的 API。该项目通过实现高效的量化技术来减少模型大小并提高推理速度,同时保持较高的准确率。它支持多种预训练模型,并且与 Hugging Face 的 Transformers 库集成,使得运行和训练量化后的 GPTQ 模型变得更加便捷。AutoGPTQ 适用于需要优化资源使用效率或加速推理过程的应用场景,比如在计算资源有限的设备上部署大模型、降低云服务成本等。不过需要注意的是,目前该项目已不再维护,建议转而使用 GPTQModel 获取最新的功能支持和错误修复。
Python
MIT License5.1k
Stars
543
Forks
3
Watchers
241
Issues
Star 增长
今日0
近 7 天+4
近 30 天+9
综合评分67.11
默认分支main