huawei-csl

KVarN

huawei-csl

KVarN is a native vLLM KV-cache quantization backend for your agents: 3-5x more context, throughput above FP16, and FP16-level accuracy. Calibration-free, one flag.

Python
Apache License 2.0 最后更新 2026年6月10日活跃
389
Stars
20
Forks
5
Watchers
5
Issues

Star 增长

今日+5
近 7 天+120
近 30 天+120
综合评分83.97
默认分支main