triton-inference-server

server

triton-inference-server

The Triton Inference Server provides an optimized cloud and edge inferencing solution.

AI 简介

Triton Inference Server 是一个优化的云和边缘推理解决方案。它支持多种深度学习和机器学习框架,包括TensorRT、PyTorch、ONNX等,能够在NVIDIA GPU、x86及ARM CPU或AWS Inferentia上运行。Triton提供了实时、批量、集成模型以及音视频流等多种查询类型的优化性能。适用于需要高性能推理服务的数据中心、云端以及边缘设备场景,帮助团队简化AI模型部署流程并提升效率。

Python
BSD 3-Clause "New" or "Revised" License
10.7k
Stars
1.8k
Forks
143
Watchers
780
Issues

Star 增长

今日+3
近 7 天+16
近 30 天+97
综合评分93.46
默认分支main