[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-83419":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":15,"subscribersCount":15,"size":15,"stars1d":16,"stars7d":17,"stars30d":17,"stars90d":15,"forks30d":15,"starsTrendScore":18,"compositeScore":19,"rankGlobal":10,"rankLanguage":10,"license":20,"archived":21,"fork":21,"defaultBranch":22,"hasWiki":23,"hasPages":21,"topics":24,"createdAt":10,"pushedAt":10,"updatedAt":31,"readmeContent":32,"aiSummary":10,"trendingCount":15,"starSnapshotCount":15,"syncStatus":33,"lastSyncTime":34,"discoverSource":35},83419,"lineage-skill","JuneYaooo\u002Flineage-skill","JuneYaooo"," Distill videos, PDFs, transcripts, and notes into source-backed Agent Skills.","",null,"Python",113,22,51,0,5,61,34,80.19,"Other",false,"main",true,[25,26,27,28,29,30],"course-distillation","education-ai","knowledge-distillation","knowledge-distillation-task","knowledge-management","skills","2026-06-12 04:01:41","\u003Cdiv align=\"center\">\n\n# 师承.skill \u002F Lineage Skill\n\n**把一整套高密度课程，蒸馏成可溯源、可迁移、可产出的私人方法系统。**\n\n从视频、讲义、板书、转录和笔记里抽取判断框架、案例经验、操作流程和质量标准，\n让 Agent 带着老师的方法参与你的学习、决策和工作产出。\n\n面向 Codex \u002F Claude Code \u002F OpenClaw \u002F Hermes \u002F 自定义 Agent。\n\n[![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Flicense-PolyForm%20Noncommercial%201.0.0-orange.svg)](.\u002FLICENSE)\n[![Skill](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FAI%20Agent-Skill-orange.svg)](.\u002FSKILL.md)\n\n[English](.\u002FREADME.en.md)\n\n\u003C\u002Fdiv>\n\n---\n\n## 这是什么\n\n`lineage-skill` 是一个给 Agent 使用的课程蒸馏 Skill。它把一整套视频课、训练营、讲座、PDF 讲义、板书、截图、转录和学习笔记，转化成一个可安装、可调用、可溯源的课程导师 Skill。\n\n它不是“把课总结一下”，而是把课程沉淀成一套能长期使用的知识资产：\n\n- 保留课程原意：重要结论尽量能回到课时、原文、截图或讲义。\n- 重建课程结构：把分散的视频、讲义、案例和笔记整理成概念、方法、课时索引和证据图谱。\n- 生成可用导师：让 Agent 基于这套课回答、追问、复习、演练、回查出处。\n- 产出工作资产：把老师的方法变成 checklist、playbook、template、方案初稿和质检规则。\n\n一句话：**把“我买过、看过、学过一套课”变成“我拥有一个能随时陪练和指导的课程导师”。**\n\n## 蒸馏后的核心价值\n\n一套课真正贵的地方，通常不在“知识点列表”，而在老师长期积累出来的判断框架、问题分解方式、案例经验和隐性标准。\n\n`lineage-skill` 的目标是把这些东西从几十小时、上百小时的视频里抽出来，变成 Agent 可以反复调用的能力：\n\n| 价值 | 课程蒸馏后变成什么 |\n| --- | --- |\n| **从内容消费变成方法资产** | 不只是“我看过这套课”，而是沉淀出概念体系、判断标准、操作流程、案例库和模板库。 |\n| **从一次学习变成长期陪练** | Agent 可以按你的学习进度追问、复盘、找薄弱点，把课程变成持续训练系统。 |\n| **从模糊记忆变成可溯源知识库** | 重要结论可以回到课时、原文、截图或讲义，避免把自己的理解误当成老师原意。 |\n| **从听懂道理变成实际产出** | 把老师的方法迁移到真实场景，生成方案、检查方案、设计流程、写模板、做决策辅助。 |\n\n换句话说，它解决的不是“帮我总结一下这门课”，而是：\n\n> 我怎样把一套高密度课程，变成一个能长期参与学习、判断和工作的私人方法系统？\n\n## 典型产出场景\n\n| 场景 | 你真正想要的结果 | 示例 |\n| --- | --- | --- |\n| **学透一套课** | 找出主线、难点、误区和薄弱环节，让 Agent 像导师一样持续追问 | “我学完前 5 课了，按老师的体系检查我哪里没理解到位。” |\n| **查回课程原意** | 快速定位某个观点、案例、方法出自哪里，有没有原文或截图依据 | “这个判断是不是老师讲过？如果讲过，在哪一课、原话大意是什么？” |\n| **迁移老师的方法** | 把课程里的框架用到你的具体问题，而不是停留在复述概念 | “按这套课的方法，分析我这个业务场景，指出关键判断和缺口。” |\n| **生产可复用资产** | 生成以后能反复使用的 checklist、playbook、template、方案草稿和质检标准 | “把老师的方法整理成我每次做项目都能用的流程和检查表。” |\n\n## 可选角色\n\n你可以直接告诉 Agent 想要哪种用途，也可以让它自己判断。课程范围、证据严格度、是否记录学习进度是另外的维度，不和角色混在一起。\n\n| 角色 | 适合什么 |\n| --- | --- |\n| `mentor` | 学习内化：追问、复盘、纠偏、阶段计划，把课程变成长期训练系统 |\n| `expert` | 证据回查：概念解释、课时定位、观点核对、来源引用 |\n| `consultant` | 情境决策：把老师的方法迁移到你的真实问题，给出判断、风险和建议 |\n| `practitioner` | 资产生产：沉淀 playbook、checklist、template、流程和质检规则 |\n| `custom` | 自定义工作流：按你的具体业务、研究、写作或训练流程生成 Skill |\n\n其他维度：\n\n| 维度 | 可选项 |\n| --- | --- |\n| 课程范围 | 单课、多课保留边界、多课融合 |\n| 证据策略 | 标准引用、严格溯源 |\n| 学习进度 | 不记录、记录进度并调整计划 |\n\n也可以组合使用：\n\n```text\n请把这套课整理成 mentor,practitioner 角色。\n既能像导师一样陪我学习，也能输出实操清单。\n```\n\n## 用 lineage-skill 蒸馏出的项目\n\n以下项目是基于 `lineage-skill` 流水线，从真实课程材料蒸馏出的专门领域 Skill。\n\n| 项目 | 简介 | 展示 | Stars |\n| --- | --- | --- | --- |\n| [nihaisha-tcm](https:\u002F\u002Fgithub.com\u002FJuneYaooo\u002Fnihaisha-tcm) | 倪海厦中医课程资料的 Agent Skill。来源包含 **100GB+ 视频课程材料**，最终沉淀成可触发、可检索、可溯源的专门领域 Skill，支持课程检索、方证穴位辨析、学习笔记整理与板书截图证据索引。 | ![nihaisha-tcm preview](https:\u002F\u002Fopengraph.githubassets.com\u002Flineage-skill\u002FJuneYaooo\u002Fnihaisha-tcm) | ![GitHub Repo stars](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002FJuneYaooo\u002Fnihaisha-tcm?style=social) |\n\n## 它如何实现这些价值\n\n这些价值不是靠一次性总结实现的，而是靠一条保留证据、压缩结构、再固化为能力的蒸馏路径。\n\n![lineage-skill 方法论价值路径](.\u002Fdocs\u002Fimg\u002Flineage-methodology-value-zh.png)\n\n`lineage-skill` 按 `Capture -> Cite -> Compress -> Connect -> Codify -> Evaluate` 工作：先保留证据，再压缩蒸馏；先区分课时、讲义、板书、案例和笔记，再整理成概念、方法、步骤、模板和导师能力。\n\n- **Capture**：采集视频、音频、讲义、截图、OCR、转录和笔记。\n- **Cite**：保留课时、时间戳、原文、截图和文档来源。\n- **Compress**：把长材料压缩成结构化摘要和课程脉络。\n- **Connect**：连接概念、案例、方法、课时和使用场景。\n- **Codify**：把老师的方法固化成流程、清单、模板和判断标准。\n- **Evaluate**：用课程标准做复盘、质检、追问和应用检查。\n\n## 它具备哪些能力\n\n这套 Skill 本身就包含课程蒸馏所需的主要流水线。你不需要自己设计“怎么把视频课变成导师”，只需要提供课程材料，并配置合适的模型接口。\n\n| 能力 | 它会做什么 | 产物 |\n| --- | --- | --- |\n| 视频 \u002F 音频转录 | 从 `.mp4` 提取音频，或直接转录 `.mp3`、`.wav`、`.m4a` 等音频；长音频会自动分段 | `transcripts\u002F*.json` |\n| 视频视觉理解 | 调用视觉模型分析 PPT、板书、软件界面、图表、动作示范和关键画面 | `analysis\u002F*_analysis.md` |\n| 大视频处理 | 对大视频压缩、按时间分片，降低模型上传和理解压力 | 分片分析结果 |\n| 干货截图提取 | 让视觉模型标记值得回看的画面，再从原视频抽帧；相似截图会去重 | `analysis\u002Fscreenshots\u002F` |\n| PDF \u002F 文档解析 | 接入 MinerU 等 OCR \u002F 文档解析结果，把扫描 PDF、图片 PDF、讲义纳入证据 | `documents\u002F`、`mineru_supplement.md` |\n| 课程蒸馏 | 整合转录、画面分析、截图证据、OCR 和笔记，提炼概念、方法、案例、引用 | `course_distillation_*.md\u002Fjson` |\n| CoursePackage 构建 | 把课程蒸馏结果变成统一结构，保留 evidence map、lesson index 和质量信息 | `course_package.json` |\n| 多课程合并 | 把多个课程包合成一个跨课程 Skill 的输入 | combined `course_package.json` |\n| 专属导师 Skill 生成 | 默认生成 `mentor`，也可按用途生成其他角色 | 可安装\u002F调用的课程 Skill |\n| 断点与进度记录 | 记录每个阶段状态、已有产物和下一步，可从已有产物继续 | `lineage_progress.json` |\n| 多课程目录索引 | 扫描多个课程工作区和已生成 Skill，形成总目录 | `course_catalog.json` |\n\n## 怎么使用\n\n### 1. 让 Agent 安装这个 Skill\n\n把这段话发给你的 Agent：\n\n```text\n请安装这个 Skill：\nhttps:\u002F\u002Fraw.githubusercontent.com\u002FJuneYaooo\u002Flineage-skill\u002Fmain\u002Fdocs\u002Finstall.md\n\n安装后请告诉我可以怎样把我的课程材料整理成课程专家。\n```\n\n### 2. 配置需要的材料、工具和模型接口\n\n你只需要先准备课程材料、本地基础工具和模型接口。常用配置直接看这一节即可；`docs\u002Finstall.md` 只保留给 Agent 自动安装用。\n\n#### 2.1 课程材料\n\n把材料放在一个本地目录里即可，不要求提前整理成固定格式：\n\n- 视频：`.mp4`\n- 音频：`.mp3`、`.wav`、`.m4a`、`.aac`、`.flac`、`.ogg`、`.opus`\n- 文档：PDF、讲义、截图、OCR Markdown\n- 已有文本：转录、课程笔记、学习总结、案例整理\n\n如果你已经有转录、OCR 文档或笔记，可以跳过重新转录和视觉分析，直接进入课程蒸馏和 Skill 生成。\n\n#### 2.2 本地工具\n\n基础依赖：\n\n```bash\ngit\npython3\npip\n```\n\n处理视频或原始音频时还需要：\n\n```bash\nffmpeg\nffprobe\n```\n\nmacOS 可以用：\n\n```bash\nbrew install ffmpeg\n```\n\nUbuntu \u002F Debian 可以用：\n\n```bash\nsudo apt-get update\nsudo apt-get install -y ffmpeg\n```\n\n只从已有转录、OCR 和笔记打包 Skill 时，可以暂时不装 `ffmpeg`。\n\n#### 2.3 模型接口\n\n`lineage-skill` 默认按 OpenAI-compatible 接口读取环境变量。推荐通过当前 Agent 的环境变量配置、系统环境变量或私有 `.env` 注入，不要把真实 key 写进 README、示例文件或公开仓库。\n\n如果你用本仓库脚本直跑，可以复制 `.env.example` 为 `.env`，只填写实际会用到的 provider：\n\n```bash\ncp .env.example .env\n```\n\n常用变量如下：\n\n```bash\n# 语音转文字：处理视频 \u002F 音频时需要\nAUDIO_TRANSCRIBE_API_KEY=\nAUDIO_TRANSCRIBE_BASE_URL=https:\u002F\u002Fapi.siliconflow.cn\u002Fv1\nAUDIO_TRANSCRIBE_MODEL=FunAudioLLM\u002FSenseVoiceSmall\n\n# 视频 \u002F 视觉理解：需要有视频理解能力的模型\nLINEAGE_VISION_API_KEY=\nLINEAGE_VISION_BASE_URL=https:\u002F\u002Fyour-openai-compatible-vision-endpoint\u002Fv1\nLINEAGE_VISION_MODEL=gemini-3.1-pro-preview\nLINEAGE_VISION_TIMEOUT=600\n\n# 文本蒸馏：把转录、视觉分析、OCR 和笔记整理成课程知识结构时建议配置\nLINEAGE_TEXT_API_KEY=\nLINEAGE_TEXT_BASE_URL=https:\u002F\u002Fapi.openai.com\u002Fv1\nLINEAGE_TEXT_MODEL=gpt5.5\nLINEAGE_TEXT_MAX_TOKENS=4096\nLINEAGE_TEXT_TIMEOUT=300\n\n# 可选：PDF \u002F OCR 文档解析。只有扫描 PDF、图片 PDF、复杂讲义需要提交给 MinerU 时才填\nMINERU_API_TOKEN=\n```\n\n最小配置按你的材料决定：\n\n| 你的材料 | 至少需要配置 |\n| --- | --- |\n| 已有转录、OCR、笔记 | `LINEAGE_TEXT_*`；如果只做本地抽取式整理，可把 `DISTILL_USE_LLM=0` |\n| 音频课程 | `AUDIO_TRANSCRIBE_*`、`LINEAGE_TEXT_*`，并安装 `ffmpeg` |\n| 视频课程，只关心老师说了什么 | `AUDIO_TRANSCRIBE_*`、`LINEAGE_TEXT_*`，并安装 `ffmpeg` |\n| 视频课程，还要理解 PPT \u002F 板书 \u002F 软件操作 | `AUDIO_TRANSCRIBE_*`、`LINEAGE_VISION_*`、`LINEAGE_TEXT_*`，并安装 `ffmpeg` |\n| 扫描 PDF \u002F 图片 PDF \u002F 复杂讲义 | 上面对应配置，加 `MINERU_API_TOKEN`；如果已有 OCR 结果，可以不配 MinerU |\n\n模型选择建议：\n\n- 语音转文字示例使用 SiliconFlow 的 `FunAudioLLM\u002FSenseVoiceSmall`，适合先跑中文课程。\n- 视频 \u002F 视觉理解模型必须支持视频输入，示例使用 `gemini-3.1-pro-preview`。\n- 文本蒸馏模型建议选长上下文、中文理解好、结构化输出稳定的模型。\n- OCR 结果只是证据层，扫描质量差、公式、表格和关键图示建议人工抽查。\n\n### 3. 告诉 Agent 你的材料在哪里\n\n例如：\n\n```text\n我有一个视频\u002F音频课程目录，还有一批 PDF 讲义。\n请用 lineage-skill 把它们整理成一个课程专家 Skill。\n回答时要尽量保留来源，方便我以后回查。\n```\n\n如果你已经有转录或笔记：\n\n```text\n我已经有课程转录文本、OCR 文档和课程笔记。\n请跳过重新采集，直接整理成可问答、可复习、可检索的课程 Skill。\n```\n\n### 4. 用自然语言调用它\n\n整理完成后，它就像一个只围绕这套课工作的专属导师。你可以这样问：\n\n```text\n我学完前 5 课了。请按老师的体系复盘我的理解，追问我最可能漏掉的关键判断。\n```\n\n```text\n按这套课的方法，分析我下面这个真实项目，指出关键假设、判断步骤和风险。\n```\n\n```text\n把老师的方法整理成一个可复用 playbook：适用场景、输入材料、操作步骤、检查标准、常见误区。\n```\n\n```text\n这个结论是不是课程原意？请给出课时、原文大意、证据强弱，以及哪些部分是合理推断。\n```\n\n```text\n用老师的判断标准检查我这份方案，告诉我哪里跳步、哪里证据不足、哪里偏离课程方法。\n```\n\n## 开源引用\n\n如果你使用 `lineage-skill` 蒸馏课程并开源生成的 Skill，建议在生成项目的 README 或说明中引用本仓库，方便后来者追溯生成方法和工具来源。\n\n也欢迎在本仓库的 Issue 里分享你蒸馏出来的优质开源 Skill 或课程知识项目。\n\n## 致谢\n\n- [Datawhale](https:\u002F\u002Fgithub.com\u002Fdatawhalechina) — 感谢 Datawhale 开源社区长期在 AI 教育、开源课程和学习者社区建设上的投入与启发。\n- [LINUX DO — 中文开发者社区](https:\u002F\u002Flinux.do\u002F) — 感谢 LINUX DO 社区的讨论、反馈和传播支持，也欢迎大家在社区里交流课程蒸馏与 Agent Skill 实践。\n\n## License\n\n本项目采用 [PolyForm Noncommercial License 1.0.0](.\u002FLICENSE) 授权。\n\n商业使用或者商务合作请联系 \u003Cjuneyaooo@gmail.com>。\n",2,"2026-06-11 04:11:07","CREATED_QUERY"]