[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-71162":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":17,"stars7d":18,"stars30d":19,"stars90d":16,"forks30d":16,"starsTrendScore":20,"compositeScore":21,"rankGlobal":10,"rankLanguage":10,"license":22,"archived":23,"fork":23,"defaultBranch":24,"hasWiki":25,"hasPages":23,"topics":26,"createdAt":10,"pushedAt":10,"updatedAt":27,"readmeContent":28,"aiSummary":29,"trendingCount":16,"starSnapshotCount":16,"syncStatus":30,"lastSyncTime":31,"discoverSource":32},71162,"CapsWriter-Offline","HaujetZhao\u002FCapsWriter-Offline","HaujetZhao","PC 端语音输入工具，离线识别，高准确率、低延迟，支持热词、LLM润色。按住CapsLock或鼠标侧键X2说话，松开自动上屏。","",null,"Python",5643,521,33,158,0,26,74,250,78,39.15,"MIT License",false,"master",true,[],"2026-06-12 02:02:48","# CapsWriter-Offline (v2.5)\n\n![demo](assets\u002Fdemo.png)\n\n> **按住 CapsLock 说话，松开就上屏。就这么简单。**\n\n**CapsWriter-Offline** 是一个专为 Windows 打造的**完全离线**语音输入工具。\n\n## ✨ 核心特性\n\n-   **语音输入**：按住 `CapsLock键` 或 `鼠标侧键X2` 说话，松开即输入，超低延迟，默认去除末尾逗句号。支持对讲机模式和单击录音模式。\n-   **文件转录**：音视频文件往客户端 exe 一丢，字幕 (`.srt`)、文本 (`.txt`)、时间戳 (`.json`) 统统都有。\n-   **数字 ITN**：自动将「十五六个」转为「15~16个」，支持各种复杂数字格式。\n-   **热词替换**：在 `hot.txt` 记下偏僻词，通过音素模糊匹配，相似度大于阈值则强制替换。\n-   **正则替换**：在 `hot-rule.txt` 用正则或简单等号规则，精准强制替换。\n-   **LLM 角色**：预置了润色、小助理等角色，当识别结果的开头匹配任一角色名字时，将交由该角色处理。\n-   **托盘菜单**：右键托盘图标即可添加热词、复制结果、清除LLM记忆。\n-   **C\u002FS 架构**：服务端与客户端分离，虽然 Win7 老电脑跑不了服务端模型，但最少能用客户端输入。\n-   **日记归档**：按日期保存你的每一句语音及其识别结果。\n-   **录音保存**：所有语音均保存为本地音频文件，隐私安全，永不丢失。\n\n**CapsWriter-Offline** 的精髓在于：**完全离线**（不受网络限制）、**响应极快**、**高准确率** 且 **高度自定义**。我追求的是一种「如臂使指」的流畅感，让它成为一个专属的一体化输入利器。无需安装，一个U盘就能带走，随插随用，保密电脑也能用。\n\n以下为支持的模型：\n\n| 引擎名 | 准确性 | 速度 | 格式 | 显卡加速 |\n|------|-------|------|------|---------|\n| Paraformer | ★★★☆☆ | ★★★★★ | ONNX | ❌ |\n| SenseVoice-Small | ★★★☆☆ | ★★★★★ | ONNX | ✅ |\n| Fun-ASR-Nano | ★★★★☆ | ★★★★☆ | ONNX + GGUF | ✅ |\n| Qwen3-ASR | ★★★★★ | ★★★☆☆ | ONNX + GGUF | ✅ |\n\n\n性能参考（20s 音频转录延迟）：\n\n| 模型 | CPU U9-285H | GPU RTX5050 |\n|------|------------|------------|\n| Paraformer | 0.6s | - |\n| SenseVoice-Small | 0.6s | 0.15s |\n| Fun-ASR-Nano | 2.0s | 0.5s |\n| Qwen3-ASR-1.7B | 4.0s | 1.0s |\n\n详细功能说明请参考 [`docs\u002F`](docs\u002F) 目录：\n- [环境依赖安装说明](docs\u002F环境依赖安装说明.md) — VC++ 运行库、FFmpeg 安装\n- [热词功能如何使用](docs\u002F热词功能如何使用.md) — 热词替换、规则替换、自定义短语\n- [角色功能如何使用](docs\u002F角色功能如何使用.md) — LLM 角色配置、输出模式、创建新角色\n- [识别语言如何配置](docs\u002F识别语言如何配置.md) — 各引擎语言支持范围与配置方法\n- [文件转录功能如何使用](docs\u002F文件转录功能如何使用.md) — 拖拽转字幕、时间戳对齐\n- [显卡加速的若干问题](docs\u002F显卡加速的若干问题.md) — DirectML、Vulkan 加速配置\n- [模型下载的若干问题](docs\u002F模型下载的若干问题.md) — 引擎选择、模型下载、目录结构\n- [常见问题](docs\u002F常见问题.md) — FAQ\n- [更新日志](docs\u002FCHANGELOG.md) \n\n\n## 💻 平台支持\n\n目前**仅能保证在 Windows 10\u002F11 (64位) 下完美运行**。\n\n- **Linux**：暂无环境进行测试和打包，无法保证兼容性。\n- **MacOS**：由于底层的 `keyboard` 库已放弃支持 MacOS，且系统限制极多，暂时无法支持。\n\n[LazyTyper](https:\u002F\u002Flazytyper.com\u002F) 和 [闪电说](https:\u002F\u002Fshandianshuo.cn\u002F) 也是很优秀的作品，都有离线引擎，都支持 Windows Linux 与 MacOS，并都有漂亮的图形化页面，推荐使用。\n\nCapsWriter 的特别之处在于追求：\n\n- 无感输入\n- 完全离线，不受网络约束\n- 低延迟，尽量做到硬件极限的最快速度\n- 高度自定义的热词系统\n\n\n## 🎬 快速开始\n\n1.  **准备环境**：确保安装了 [VC++ 运行库](https:\u002F\u002Flearn.microsoft.com\u002Fzh-cn\u002Fcpp\u002Fwindows\u002Flatest-supported-vc-redist)。若要使用文件转录功能，还需安装 [ffmpeg](https:\u002F\u002Fffmpeg.org\u002Fdownload.html) 并确保其在系统 PATH 中。\n2.  **下载解压**：下载 [Latest Release](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FCapsWriter-Offline\u002Freleases\u002Flatest) 里的软件本体，再到 [Models Release](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FCapsWriter-Offline\u002Freleases\u002Ftag\u002Fmodels) 下载模型压缩包，将模型解压，放入 `models` 文件夹中对应模型的文件夹里。\n3.  **启动服务**：双击 `start_server.exe`，**它会自动最小化到托盘菜单**。\n4.  **启动听写**：双击 `start_client.exe`，**它会自动最小化到托盘菜单**。\n5.  **开始录音**：按住 `CapsLock键` 或 `鼠标侧键X2` 就可以说话了！\n\n\n## ⚙️ 个性化配置\n\n所有的设置都在根目录的 `config_server.py` 和 `config_client.py` 里，可直接编辑。\n\n\n## 🛠️ 常见问题\n\n\n**Q: 为什么按了没反应？**  \nA: 请确认 `start_client.exe` 的黑窗口还在运行。若想在管理员权限运行的程序中输入，也需以管理员权限运行客户端。\n\n**Q: 为什么识别结果没字？**  \nA: 到 `年\u002F月\u002Fassets` 文件夹中检查录音文件，看是不是没有录到音；听听录音效果，是不是麦克风太差，建议使用桌面 USB 麦克风；检查麦克风权限。\n\n**Q: 想要隐藏黑窗口？**  \nA: 点击托盘菜单即可隐藏黑窗口。\n\n**Q: 如何开机启动？**  \nA: `Win+R` 输入 `shell:startup` 打开启动文件夹，将服务端、客户端的快捷方式放进去即可。\n\n更多问题请参阅 [docs\u002F常见问题.md](docs\u002F常见问题.md)。\n\n\n## 🚀 我的其他优质项目推荐\n\n| 项目名称 | 说明 | 体验地址 |\n| :--- | :--- | :--- |\n| [**IME_Indicator**](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FIME_Indicator) | Windows 输入法中英状态指示器 | [下载即用](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FIME_Indicator\u002Freleases\u002Flatest\u002Fdownload\u002FIME-Indicator.exe) |\n| [**Rust-Tray**](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FRust-Tray) | 将控制台最小化到托盘图标的工具 | [下载即用](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FRust-Tray\u002Freleases\u002Flatest\u002Fdownload\u002FTray.exe) |\n| [**Gallery-Viewer**](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FGallery-Viewer-HTML) | 网页端图库查看器，纯 HTML 实现 | [点击即用](https:\u002F\u002Fhaujetzhao.github.io\u002FGallery-Viewer-HTML\u002F) |\n| [**全景图片查看器**](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FPanorama-Viewer-HTML) | 单个网页实现全景照片、视频查看 | [点击即用](https:\u002F\u002Fhaujetzhao.github.io\u002FPanorama-Viewer-HTML\u002F) |\n| [**图标生成器**](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FFont-Awesome-Icon-Generator-HTML) | 使用 Font-Awesome 生成网站 Icon | [点击即用](https:\u002F\u002Fhaujetzhao.github.io\u002FFont-Awesome-Icon-Generator-HTML\u002F) |\n| [**五笔编码反查**](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002Fwubi86-revert-query) | 86 五笔编码在线反查 | [点击即用](https:\u002F\u002Fhaujetzhao.github.io\u002Fwubi86-revert-query\u002F) |\n| [**快捷键映射图**](https:\u002F\u002Fgithub.com\u002FHaujetZhao\u002FShortcutMapper_Chinese) | 可视化、交互式的快捷键映射图 (中文版) | [点击即用](https:\u002F\u002Fhaujetzhao.github.io\u002FShortcutMapper_Chinese\u002F) |\n\n\n## ❤️ 致谢\n\n本项目基于以下优秀的开源项目：\n\n-   [Sherpa-ONNX](https:\u002F\u002Fgithub.com\u002Fk2-fsa\u002Fsherpa-onnx)\n-   [FunASR](https:\u002F\u002Fgithub.com\u002Falibaba-damo-academy\u002FFunASR)\n\n感谢 Google Antigravity、Anthropic Claude、GLM、DeepSeek，如果不是这些编程助手，许多功能（例如基于音素的热词检索算法）我是无力实现的。\n\n特别感谢那些慷慨解囊的捐助者，你们的捐助让我用在了购买这些优质的 AI 编程助手服务，并最终将这些成果反馈到了软件的更新里。\n\n\n如果觉得好用，欢迎点个 Star 或者打赏支持：\n\n\n![sponsor](assets\u002Fsponsor.jpg)\t\n","CapsWriter-Offline 是一个专为 Windows 设计的完全离线语音输入工具，支持热词和LLM处理。用户只需按住 CapsLock 或鼠标侧键X2 说话，松开后即可自动上屏。其核心功能包括超低延迟的语音输入、文件转录（支持音视频文件转换为字幕、文本和时间戳）、数字格式转换、热词替换、正则替换以及预置的LLM角色处理等。该工具采用C\u002FS架构，服务端与客户端分离，保证了在不同硬件环境下的可用性，并且所有数据均保存在本地，确保隐私安全。适用于需要高效、私密且高度自定义的语音输入场景，如写作、笔记记录或会议记录等。",2,"2026-06-11 03:36:22","high_star"]