
speech-tokenizer-arena
andraiming
A side-by-side benchmarking playground for discrete speech tokenizers (EnCodec, HuBERT-units, SpeechTokenizer, etc.).
AI 简介
Speech Tokenizer Arena 是一个用于对比评估不同离散语音编码器(如EnCodec、HuBERT-units、SpeechTokenizer等)性能的基准测试工具。项目核心功能包括对同一音频样本使用多种编码器进行处理,并生成包含重构质量(如mel-SD、SI-SDR、STOI、PESQ)、有效比特率及下游自动语音识别错误率等指标的排行榜。该工具基于Python开发,利用PyTorch框架支持多种采样率和比特率设置下的编码器比较。适用于需要选择合适语音编码器以优化特定应用场景下音频处理效果的研究者或开发者,比如在构建低延迟通信系统或是高效存储解决方案时。
Python
Other222
Stars
9.2k
Forks
6
Watchers
0
Issues
Star 增长
今日0
近 7 天0
近 30 天+146
综合评分60
默认分支main