vllm-project

vllm-omni

vllm-project

A framework for efficient model inference with omni-modality models

AI 简介

vllm-omni 是一个用于全模态模型高效推理的框架。它支持音频生成、图像生成、视频生成等多种模态,并通过 PyTorch 和 Transformer 技术实现高性能推理。项目具备强大的量化和分布式执行能力,优化了在 CUDA、ROCm、NPU、XPU 等多种硬件平台上的性能。vllm-omni 适用于需要处理多模态数据的应用场景,如多媒体内容生成、智能助手技能开发等,能够显著提升模型服务的速度和成本效益。

Python
Apache License 2.0
5.1k
Stars
1.1k
Forks
51
Watchers
490
Issues

Star 增长

今日+102
近 7 天+219
近 30 天+426
综合评分115.12
默认分支main