
tts-prosody-probe
saadansha
Probe and compare the prosody (pitch / energy / duration) of TTS outputs.
AI 简介
该项目是一个用于提取和比较TTS音频输出的韵律(音高、能量、时长)的小型CLI工具或库。其核心功能包括通过Python接口或命令行界面提取音频文件的音高轮廓,并对比两个音频文件之间的韵律差异,提供如音高RMSE、能量RMSE等指标来量化这些差异。适合于评估新的TTS模型是否在自然度上有所改进,而不仅仅是频谱保真度上的变化。对于从事语音合成研究与开发的专业人士来说,这是一个实用的辅助工具。
Python
Other223
Stars
11.5k
Forks
6
Watchers
0
Issues
Star 增长
今日0
近 7 天0
近 30 天+189
综合评分60
默认分支main