[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-80991":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":8,"htmlUrl":8,"language":9,"languages":8,"totalLinesOfCode":8,"stars":10,"forks":11,"watchers":12,"openIssues":13,"contributorsCount":13,"subscribersCount":13,"size":13,"stars1d":14,"stars7d":15,"stars30d":11,"stars90d":13,"forks30d":13,"starsTrendScore":16,"compositeScore":17,"rankGlobal":8,"rankLanguage":8,"license":18,"archived":19,"fork":19,"defaultBranch":20,"hasWiki":21,"hasPages":19,"topics":22,"createdAt":8,"pushedAt":8,"updatedAt":23,"readmeContent":24,"aiSummary":25,"trendingCount":13,"starSnapshotCount":13,"syncStatus":14,"lastSyncTime":26,"discoverSource":27},80991,"plaud-pipeline","xclgordon\u002Fplaud-pipeline","xclgordon",null,"Python",34,4,30,0,2,3,6,45,"Apache License 2.0",false,"main",true,[],"2026-06-12 04:01:31","# 📥 Plaud Pipeline\n\n> 从会议录音到可交互知识库的全自动管线 — 录音 → 分割 → 具名 → 纪要 → Wiki → RAG\n\n一个**全自动化管线**，将会议录音经过说话人分割、身份具名、AI 纪要合并、知识库 Wiki 生成，最终呈现为 Notion 风格的 Web 知识库，支持全文搜索和 RAG 问答。\n\n```\n录音(.ogg)  →  [①扫描]  →  [②分割]  →  [③具名]  →  [④纪要]  →  [⑥Wiki]  →  🌐 Web 知识库\n                                  pyannote    3-phase     LLM        LLM        + RAG Q&A\n                                  + FunASR    漏斗                     合成        + 说话人编辑器\n```\n\n---\n\n## 特性\n\n- 🎙️ **GPU 加速说话人分割** — pyannote community-1 + FunASR Paraformer，~28x 实时\n- 🏷️ **94% 说话人具名率** — 3 阶段漏斗：Plaud 标签 → 声纹传播 → LLM 推断\n- 📝 **结构化 AI 纪要** — 含决策表、行动项（精准分配到人）、议题要点\n- 🏠 **Notion 风格 Wiki** — 人物档案、客户档案、决策日志、行动项看板、时间线\n- 💬 **RAG 知识库问答** — Bigram 中文搜索 + LLM 答案生成（带引用来源）\n- 🔄 **幂等自愈** — 每步独立检查输入\u002F输出，中断后重跑不丢进度\n\n---\n\n## 前置条件\n\n- **OS**: Ubuntu 22.04+ \u002F macOS (Apple Silicon)\n- **GPU**: NVIDIA GPU ≥ 8GB 显存（pyannote 需要；Apple MPS 也可用）\n- **Python**: 3.11+\n- **ffmpeg**: `apt install ffmpeg`\n- **HuggingFace**: 注册账号并接受 [pyannote 模型使用协议](https:\u002F\u002Fhuggingface.co\u002Fpyannote\u002Fspeaker-diarization-community-1)\n- **LLM**: [Claude CLI](https:\u002F\u002Fdocs.anthropic.com\u002Fen\u002Fdocs\u002Fclaude-code) 或 OpenAI 兼容接口\n\n---\n\n## 快速开始\n\n```bash\n# 1. 克隆仓库\ngit clone https:\u002F\u002Fgithub.com\u002Fyourname\u002Fplaud-pipeline\ncd plaud-pipeline\n\n# 2. 创建虚拟环境\npython3 -m venv venv\nsource venv\u002Fbin\u002Factivate\npip install -r requirements.txt\n\n# 3. 配置\ncp config\u002F.env.example .env\ncp config\u002Forg_chart.example.md config\u002Forg_chart.md\n# 编辑 .env 填入你的 LLM 配置\n# 编辑 config\u002Forg_chart.md 填入你的组织架构\n\n# 4. 丢录音进 recordings\u002F\ncp \u002Fpath\u002Fto\u002Fyour\u002Fmeeting.ogg recordings\u002F\n\n# 5. 运行管线\npython scripts\u002Fpipeline.py\n\n# 6. 启动 Wiki 浏览\npython scripts\u002Fwiki_server.py --port 8899\n# 打开 http:\u002F\u002Flocalhost:8899\n```\n\n---\n\n## 管线步骤\n\n| 步骤 | 功能 | 技术 | 输入 → 输出 |\n|------|------|------|-------------|\n| ① 扫描 | 检测新录音 | 文件系统扫描 | `recordings\u002F*.ogg` → new IDs |\n| ② 分割 | 说话人分割 + ASR | pyannote + FunASR (GPU) | `.ogg` → `transcripts_diarized\u002F*.json` |\n| ③ 具名 | 说话人身份识别 | 3-phase 漏斗 | diarized → `transcripts_anchor_named\u002F*.json` |\n| ④ 纪要 | AI 合并纪要 | LLM | named + Plaud notes → `ai_notes_merged\u002F*.md` |\n| ⑤ 通知 | 每日摘要推送 | Telegram Bot | → 推送消息 |\n| ⑥ Wiki | 知识库生成 | Python + LLM | 纪要 → `wiki\u002F` |\n\n---\n\n## 配置说明\n\n| 环境变量 | 必需 | 说明 |\n|----------|------|------|\n| `CLAUDE_BIN` | 是 | Claude CLI 路径（默认: `claude`） |\n| `TELEGRAM_BOT_TOKEN` | 否 | Telegram Bot Token（不设则跳过通知） |\n| `TELEGRAM_HOME_CHANNEL` | 否 | Telegram 频道 ID |\n| `PLAUD_DATA_DIR` | 否 | 数据目录（默认: `~\u002Fplaud-knowledge-base`） |\n| `PLAUD_CONFIG_DIR` | 否 | 配置目录（默认: `~\u002Fplaud-pipeline\u002Fconfig`） |\n| `HF_HUB_OFFLINE` | 否 | 设为 `1` 使用离线模型缓存 |\n\n---\n\n## 已知限制\n\n- **GPU 必需** — CPU 模式下 pyannote 极慢（>100x 实时）\n- **中文 only** — FunASR Paraformer 专为中文优化\n- **声纹局限** — CAM++ 跨录音相似度 0.50-0.65，同录音不同人可达 0.97。不能纯靠声纹\n- **Plaud API** — 非官方接口，见 `docs\u002Fintegrations\u002Fplaud.md`。本仓库只提供 FolderSource\n\n---\n\n## 文档\n\n- [架构设计与实现原理](docs\u002Farchitecture.md)\n- [Plaud API 接入指南](docs\u002Fintegrations\u002Fplaud.md)\n\n---\n\n## 协议\n\nApache License 2.0 — 详见 [LICENSE](LICENSE)\n","Plaud Pipeline 是一个将会议录音转换为可交互知识库的全自动化管线。其核心功能包括使用 GPU 加速的说话人分割、高达 94% 的说话人具名率、结构化的 AI 纪要生成、Notion 风格的知识库 Wiki 以及支持 RAG 问答的全文搜索。项目利用了 pyannote 和 FunASR 进行高效准确的音频处理，再通过 LLM 完成内容理解和生成。适用于需要从会议记录中提取和管理信息的企业或团队，特别适合频繁开会且希望提高会议记录整理效率与可用性的场景。","2026-06-11 04:03:06","CREATED_QUERY"]