[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-72007":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":17,"stars7d":18,"stars30d":19,"stars90d":16,"forks30d":16,"starsTrendScore":20,"compositeScore":21,"rankGlobal":10,"rankLanguage":10,"license":22,"archived":23,"fork":23,"defaultBranch":24,"hasWiki":25,"hasPages":23,"topics":26,"createdAt":10,"pushedAt":10,"updatedAt":29,"readmeContent":30,"aiSummary":31,"trendingCount":16,"starSnapshotCount":16,"syncStatus":32,"lastSyncTime":33,"discoverSource":34},72007,"ChatTTS-ui","jianchang512\u002FChatTTS-ui","jianchang512","一个简单的本地网页界面，使用ChatTTS将文字合成为语音，同时支持对外提供API接口。A simple native web interface that uses ChatTTS to synthesize text into speech, along with support for external API interfaces.","https:\u002F\u002Fpyvideotrans.com",null,"Python",7596,917,42,197,0,8,22,45,24,39.89,"Other",false,"main",true,[27,28],"chattts","tts","2026-06-12 02:02:57","\n[English README](README_EN.md) | [打赏项目](https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FChatTTS-ui\u002Fissues\u002F122) | [Discord Discussion Group](https:\u002F\u002Fdiscord.gg\u002Fy9gUweVCCJ)\n\n\n# ChatTTS webUI & API \n\n一个简单的本地网页界面，在网页使用 ChatTTS 将文字合成为语音，支持中英文、数字混杂，并提供API接口.\n\n\n原 [ChatTTS](https:\u002F\u002Fgithub.com\u002F2noise\u002Fchattts) 项目. 0.96版起，源码部署必须先安装ffmpeg ,之前的音色文件csv和pt已不可用，请填写音色值重新生成.[获取音色](?tab=readme-ov-file#音色获取)\n\n\n\n**界面预览**\n\n![image](https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FChatTTS-ui\u002Fassets\u002F3378335\u002F669876cf-5061-4d7d-86c5-3333d0882ee8)\n\n\n\n\n\n\n文字数字符号 控制符混杂效果\n\nhttps:\u002F\u002Fgithub.com\u002Fjianchang512\u002FChatTTS-ui\u002Fassets\u002F3378335\u002Fe2a08ea0-32af-4a30-8880-3a91f6cbea55\n\n\n## Windows预打包版\n\n1. 从 [Releases](https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FchatTTS-ui\u002Freleases)中下载压缩包，解压后双击 app.exe 即可使用\n2. 某些安全软件可能报毒，请退出或使用源码部署\n3. 英伟达显卡大于4G显存，并安装了CUDA11.8+后，将启用GPU加速\n\n## 手动下载模型\n\n第一次将从huggingface.co或github下载模型到asset目录下，如果网络不稳，可能下载失败，若是失败，请单独下载\n\n下载后解压后，会看到asset文件夹，该文件夹内有多个pt文件，将所有pt文件复制到asset目录下，然后重启软件\n\nGitHub下载地址: https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FChatTTS-ui\u002Freleases\u002Fdownload\u002Fv1.0\u002Fall-models.7z\n\n百度网盘下载地址: https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1yGDZM9YNN7kW9e7SFo8lLw?pwd=ct5x\n\n\n\n## Linux 下容器部署\n\n### 安装\n\n1. 拉取项目仓库\n\n   在任意路径下克隆项目，例如：\n\n   ```bash\n   git clone https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FChatTTS-ui.git chat-tts-ui\n   ```\n\n2. 启动 Runner\n\n   进入到项目目录：\n\n   ```bash\n   cd chat-tts-ui\n   ```\n\n   启动容器并查看初始化日志：\n\n   ```bash\n   gpu版本\n   docker compose -f docker-compose.gpu.yaml up -d \n\n   cpu版本    \n   docker compose -f docker-compose.cpu.yaml up -d\n\n   docker compose logs -f --no-log-prefix\n\n3. 访问 ChatTTS WebUI\n\n   `启动:['0.0.0.0', '9966']`，也即，访问部署设备的 `IP:9966` 即可，例如：\n\n   - 本机：`http:\u002F\u002F127.0.0.1:9966`\n   - 服务器: `http:\u002F\u002F192.168.1.100:9966`\n\n### 更新\n\n1. Get the latest code from the main branch:\n\n   ```bash\n   git checkout main\n   git pull origin main\n   ```\n\n2. Go to the next step and update to the latest image:\n\n   ```bash\n   docker compose down\n\n   gpu版本\n   docker compose -f docker-compose.gpu.yaml up -d --build\n\n   cpu版本\n   docker compose -f docker-compose.cpu.yaml up -d --build\n   \n   docker compose logs -f --no-log-prefix\n   ```\n\n## Linux 下源码部署\n\n1. 配置好 python3.9-3.11环境，安装 ffmpeg。 `yum install ffmpeg` 或 `apt-get install ffmpeg`等\n2. 创建空目录 `\u002Fdata\u002Fchattts` 执行命令 `cd \u002Fdata\u002Fchattts &&  git clone https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FchatTTS-ui .`\n3. 创建虚拟环境 `python3 -m venv venv`\n4. 激活虚拟环境 `source .\u002Fvenv\u002Fbin\u002Factivate`\n5. 安装依赖 `pip3 install -r requirements.txt`\n6. 如果不需要CUDA加速，执行 \n\t\n\t`pip3 install torch==2.2.0 torchaudio==2.2.0`\n\n\t如果需要CUDA加速，执行 \n\t\n\t```\n\tpip install torch==2.2.0 torchaudio==2.2.0 --index-url https:\u002F\u002Fdownload.pytorch.org\u002Fwhl\u002Fcu118\n\n\tpip install nvidia-cublas-cu11 nvidia-cudnn-cu11\n\t\t\n\t```\n\t\n\t另需安装 CUDA11.8+ ToolKit，请自行搜索安装方法 或参考 https:\u002F\u002Fjuejin.cn\u002Fpost\u002F7318704408727519270\n\n   \t除CUDA外，也可以使用AMD GPU进行加速，这需要安装ROCm和PyTorch_ROCm版本。AMG GPU借助ROCm，在PyTorch开箱即用，无需额外修改代码。\n   \t1. 请参考https:\u002F\u002Frocm.docs.amd.com\u002Fprojects\u002Finstall-on-linux\u002Fen\u002Flatest\u002Ftutorial\u002Fquick-start.html 来安装AMD GPU Driver及ROCm.\n\t1. 再通过https:\u002F\u002Fpytorch.org\u002F 安装PyTorch_ROCm版本。\n\n\n\t`pip3 install torch==2.2.0  torchaudio==2.2.0 --index-url https:\u002F\u002Fdownload.pytorch.org\u002Fwhl\u002Frocm6.0`\n\t\n    安装完成后，可以通过rocm-smi命令来查看系统中的AMD GPU。也可以用以下Torch代码(query_gpu.py)来查询当前AMD GPU Device.\n\t\n\t```\n\timport torch\n\t\n\tprint(torch.__version__)\n\t\n\tif torch.cuda.is_available():\n\t    device = torch.device(\"cuda\")          # a CUDA device object\n\t    print('Using GPU:', torch.cuda.get_device_name(0))\n\telse:\n\t    device = torch.device(\"cpu\")\n\t    print('Using CPU')\n\t\n\ttorch.cuda.get_device_properties(0)\n\n\t```\n\n \t使用以上代码，以AMD Radeon Pro W7900为例，查询设备如下。\n\n \t```\n\t\n \t$ python ~\u002Fquery_gpu.py\n\t\n\t2.4.0.dev20240401+rocm6.0\n\t\n \tUsing GPU: AMD Radeon PRO W7900\n\t\n \t```\n\n\n \n7. 执行 `python3 app.py` 启动，将自动打开浏览器窗口，默认地址 `http:\u002F\u002F127.0.0.1:9966` (注意：默认从 modelscope 魔塔下载模型，不可使用代理下载，请关闭代理)\n\n\n## MacOS 下源码部署\n\n1. 配置好 python3.9-3.11 环境,安装git ，执行命令  `brew install libsndfile git python@3.10`\n   继续执行\n\n    ```\n\tbrew install ffmpeg\n\t\n    export PATH=\"\u002Fusr\u002Flocal\u002Fopt\u002Fpython@3.10\u002Fbin:$PATH\"\n\t\n    source ~\u002F.bash_profile \n\t\n\tsource ~\u002F.zshrc\n\t\n    ```\n\t\n2. 创建空目录 `\u002Fdata\u002Fchattts` 执行命令 `cd \u002Fdata\u002Fchattts &&  git clone https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FchatTTS-ui .`\n3. 创建虚拟环境 `python3 -m venv venv`\n4. 激活虚拟环境 `source .\u002Fvenv\u002Fbin\u002Factivate`\n5. 安装依赖 `pip3 install -r requirements.txt`\n6. 安装torch `pip3 install torch==2.2.0 torchaudio==2.2.0`\n7. 执行 `python3 app.py` 启动，将自动打开浏览器窗口，默认地址 `http:\u002F\u002F127.0.0.1:9966`  (注意：默认从 modelscope 魔塔下载模型，不可使用代理下载，请关闭代理)\n\n\n## Windows源码部署\n\n1. 下载python3.9-3.11，安装时注意选中`Add Python to environment variables`\n2. 下载 ffmpeg.exe 放在 软件目录下的ffmpeg文件夹内\n3. 下载并安装git，https:\u002F\u002Fgithub.com\u002Fgit-for-windows\u002Fgit\u002Freleases\u002Fdownload\u002Fv2.45.1.windows.1\u002FGit-2.45.1-64-bit.exe \n4. 创建空文件夹 `D:\u002Fchattts` 并进入，地址栏输入 `cmd`回车，在弹出的cmd窗口中执行命令 `git clone https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FchatTTS-ui .`\n5. 创建虚拟环境，执行命令 `python -m venv venv`\n6. 激活虚拟环境，执行 `.\\venv\\scripts\\activate`\n7. 安装依赖,执行 `pip install -r requirements.txt`\n8. 如果不需要CUDA加速，\n\n\t执行 `pip install torch==2.2.0 torchaudio==2.2.0`\n\n\t如果需要CUDA加速，执行 \n\t\n\t`pip install torch==2.2.0 torchaudio==2.2.0 --index-url https:\u002F\u002Fdownload.pytorch.org\u002Fwhl\u002Fcu118`\n\t\n\t另需安装 CUDA11.8+ ToolKit，请自行搜索安装方法或参考 https:\u002F\u002Fjuejin.cn\u002Fpost\u002F7318704408727519270\n\t\n9. 执行 `python app.py` 启动，将自动打开浏览器窗口，默认地址 `http:\u002F\u002F127.0.0.1:9966`  (注意：默认从 modelscope 魔塔下载模型，不可使用代理下载，请关闭代理)\n\n\n## 源码部署注意 0.96版本起，必须安装ffmpeg\n\n1. 如果GPU显存低于4G，将强制使用CPU。\n\n2. Windows或Linux下如果显存大于4G并且是英伟达显卡，但源码部署后仍使用CPU，可尝试先卸载torch再重装，卸载`pip uninstall -y torch torchaudio` , 重新安装cuda版torch。`pip install torch==2.2.0 torchaudio==2.2.0 --index-url https:\u002F\u002Fdownload.pytorch.org\u002Fwhl\u002Fcu118`  。必须已安装CUDA11.8+\n\n3. 默认检测 modelscope 是否可连接，如果可以，则从modelscope下载模型，否则从 huggingface.co下载模型\n\n\n\n## 音色获取\n\n0.96版本后，因ChatTTS内核升级，已无法直接使用从该站点下载的pt文件(https:\u002F\u002Fmodelscope.cn\u002Fstudios\u002Fttwwwaa\u002FChatTTS_Speaker)\n\n因此增加转换脚本 cover-pt.py [Win整合包可以直接下载 cover-pt.exe 文件，和 app.exe 放在同一目录下双击执行](https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FChatTTS-ui\u002Freleases)\n\n执行  `python cover-pt.py` 后将把 `speaker` 目录下的，以 `seed_` 开头，以  `_emb.pt` 结尾的文件，即下载后的默认文件名pt，\n转换为可用的编码格式，转换后的pt将改名为以 `_emb-covert.pt` 结尾。\n\n例：\n\n假如  `speaker\u002Fseed_2155_restored_emb.pt` 存在这个文件,将被转换为 `speaker\u002Fseed_2155_restored_emb-cover.pt`, 然后删掉原pt文件，仅保留该转换后的文件即可\n\n\n\n\n\n## [常见问题与报错解决方法](faq.md)\n\n\n\n\n## 修改http地址\n\n默认地址是 `http:\u002F\u002F127.0.0.1:9966`,如果想修改，可打开目录下的 `.env`文件，将 `WEB_ADDRESS=127.0.0.1:9966`改为合适的ip和端口，比如修改为`WEB_ADDRESS=192.168.0.10:9966`以便局域网可访问\n\n## 使用API请求 v0.5+\n\n**请求方法:** POST\n\n**请求地址:** http:\u002F\u002F127.0.0.1:9966\u002Ftts\n\n**请求参数:**\n\ntext:\tstr| 必须， 要合成语音的文字\n\nvoice:\t可选，默认 2222,  决定音色的数字， 2222 | 7869 | 6653 | 4099 | 5099，可选其一，或者任意传入将随机使用音色\n\nprompt:\tstr| 可选，默认 空， 设定 笑声、停顿，例如 [oral_2][laugh_0][break_6]\n\ntemperature:\tfloat| 可选，  默认 0.3\n\ntop_p:\tfloat|  可选， 默认 0.7\n\ntop_k:\tint|  可选， 默认 20\n\nskip_refine:\tint|   可选， 默认0， 1=跳过 refine text，0=不跳过\n\ncustom_voice:\tint|  可选， 默认0，自定义获取音色值时的种子值，需要大于0的整数，如果设置了则以此为准，将忽略 `voice`\n\n\n**返回:json数据**\n\n成功返回:\n\t{code:0,msg:ok,audio_files:[dict1,dict2]}\n\t\n\t其中 audio_files 是字典数组，每个元素dict为 {filename:wav文件绝对路径，url:可下载的wav网址}\n\n失败返回:\n\n\t{code:1,msg:错误原因}\n\n```\n\n# API调用代码\n\nimport requests\n\nres = requests.post('http:\u002F\u002F127.0.0.1:9966\u002Ftts', data={\n  \"text\": \"若不懂无需填写\",\n  \"prompt\": \"\",\n  \"voice\": \"3333\",\n  \"temperature\": 0.3,\n  \"top_p\": 0.7,\n  \"top_k\": 20,\n  \"skip_refine\": 0,\n  \"custom_voice\": 0\n})\nprint(res.json())\n\n#ok\n{code:0, msg:'ok', audio_files:[{filename: E:\u002Fpython\u002Fchattts\u002Fstatic\u002Fwavs\u002F20240601-22_12_12-c7456293f7b5e4dfd3ff83bbd884a23e.wav, url: http:\u002F\u002F127.0.0.1:9966\u002Fstatic\u002Fwavs\u002F20240601-22_12_12-c7456293f7b5e4dfd3ff83bbd884a23e.wav}]}\n\n#error\n{code:1, msg:\"error\"}\n\n\n```\n\n\n## 在pyVideoTrans软件中使用\n\n> 升级 pyVideoTrans 到 1.82+ https:\u002F\u002Fgithub.com\u002Fjianchang512\u002Fpyvideotrans\n\n1. 点击菜单-设置-ChatTTS，填写请求地址，默认应该填写 http:\u002F\u002F127.0.0.1:9966\n2. 测试无问题后，在主界面中选择`ChatTTS`\n\n![image](https:\u002F\u002Fgithub.com\u002Fjianchang512\u002FChatTTS-ui\u002Fassets\u002F3378335\u002F7118325f-2b9a-46ce-a584-1d5c6dc8e2da)\n\n","ChatTTS-ui 是一个简单的本地网页界面，使用 ChatTTS 技术将文字合成为语音，并支持中英文、数字混杂的输入。项目提供了用户友好的网页界面和对外API接口，方便集成到其他应用中。它基于Python开发，支持Windows预打包版和Linux下的容器及源码部署方式，且在具备合适硬件条件下（如NVIDIA显卡大于4G显存并安装了CUDA11.8+）能够启用GPU加速以提高处理速度。此工具非常适合需要快速实现文本转语音功能的应用场景，比如在线教育、有声读物制作以及辅助无障碍浏览等。",2,"2026-06-11 03:39:56","high_star"]