
intel-extension-for-transformers
intel
⚡ Build your chatbot within minutes on your favorite device; offer SOTA compression techniques for LLMs; run LLMs efficiently on Intel Platforms⚡
AI 简介
Intel Extension for Transformers 是一个基于Transformer的工具包,旨在加速生成式AI和大型语言模型在各种设备上的运行。该项目提供了先进的压缩技术,如4位量化(INT4),支持多种硬件平台包括Intel CPU和GPU,从而实现高效的推理性能。它特别适用于需要快速构建聊天机器人、处理大规模语言模型的应用场景,并且能够通过优化技术显著提升在Intel平台上的执行效率。此外,项目还集成了诸如神经聊天等实用功能,进一步增强了其在实际应用中的灵活性与实用性。
Python
Apache License 2.02.2k
Stars
217
Forks
4
Watchers
31
Issues
Star 增长
今日0
近 7 天0
近 30 天+1
综合评分39.12
默认分支main