
mistral.rs
EricLBuehler
Fast, flexible LLM inference
AI 简介
mistral.rs 是一个用于快速、灵活的大规模语言模型(LLM)推理的项目。它支持任何Hugging Face模型,无需配置即可运行,并提供真正的多模态处理能力,包括文本、图像、视频和音频的输入与输出。该项目采用Rust语言编写,具有全量化控制功能,允许用户选择或自定义量化方案以优化模型性能。此外,mistral.rs 还内置了Web UI,并提供了针对不同硬件环境的自动调优功能,以及Python和Rust SDK供开发者构建自己的应用。适合需要高性能、低延迟的语言模型推理的应用场景,如聊天机器人、内容生成、多模态数据处理等。
Rust
MIT License7.3k
Stars
623
Forks
43
Watchers
226
Issues
Star 增长
今日0
近 7 天+34
近 30 天+158
综合评分91.39
默认分支master