[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-11338":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":9,"language":10,"languages":9,"totalLinesOfCode":9,"stars":11,"forks":12,"watchers":13,"openIssues":14,"contributorsCount":15,"subscribersCount":15,"size":15,"stars1d":15,"stars7d":14,"stars30d":16,"stars90d":15,"forks30d":15,"starsTrendScore":15,"compositeScore":17,"rankGlobal":9,"rankLanguage":9,"license":18,"archived":19,"fork":19,"defaultBranch":20,"hasWiki":21,"hasPages":19,"topics":22,"createdAt":9,"pushedAt":9,"updatedAt":23,"readmeContent":24,"aiSummary":25,"trendingCount":15,"starSnapshotCount":15,"syncStatus":26,"lastSyncTime":27,"discoverSource":28},11338,"yixueAIganhuo-PPT","snowmanzhuang\u002FyixueAIganhuo-PPT","snowmanzhuang","AI workflow (base on gpt-image-2 and paddle ocr v5) for generating PPT decks from papers, PDFs, figures, screenshots, and prepared materials, then rebuilding editable PPTX files.",null,"Python",165,32,15,1,0,65,4.56,"Other",false,"main",true,[],"2026-06-12 02:02:31","# yixueAIganhuo-PPT\n\n中文 | [English](README.en.md)\n\n一个把论文、PDF、Figure、截图、报告和自备资料等自动制作成高质量 PPT，并可进一步重建为可编辑 PPTX 的 AI PPT skill。\n\n适合论文精读、组会汇报、教学培训和日常汇报等场景。\n\n提供的 Figure、图表、影像和截图会自动按照原始比例嵌入到 PPTX 中，尽量不重画、不拉伸；生成的 PPTX 可自带演讲稿备注，方便后续汇报和讲解。\n\n这个 skill 的核心不是套模板，而是让 agent 按流程完成：\n\n```text\n资料理解 -> PPT 页面规划 -> GPT Image 2 生成图片型 PPT\n       -> PaddleOCR v5 识别文字 -> GPT Image 2 清除文字背景\n       -> 添加可编辑文字层 -> 生成 editable PPTX\n```\n\n## 能做什么\n\n- 把论文 PDF 制作成文字可编辑的汇报 PPTX。\n- 把课程资料、病例材料、实验图、截图、报告整理成文字可编辑的 PPTX。\n- 在可编辑 PPTX 中保留原始 Figure、图表、影像和截图，并按原始比例嵌入。\n- 生成带演讲稿备注的 PPTX，方便直接进入汇报准备。\n- 也可以只生成图片型 PPTX，不进入 OCR 和可编辑重建流程。\n- 也可以把已经生成好的图片型 PPTX \u002F 每页截图继续转成文字可编辑 PPTX。\n\n## 工作流原理\n\n![yixueAIganhuo-PPT 工作流原理 1](docs\u002Fassets\u002Freadme\u002Fskill-principle-1.jpg)\n\n![yixueAIganhuo-PPT 工作流原理 2](docs\u002Fassets\u002Freadme\u002Fskill-principle-2.jpg)\n\n## 示例效果\n\n下面每张图展示同一个案例中的 3 页示例；每一行从左到右包含 4 个阶段：PPT 原图、OCR 文字识别图、清除文字背景、最终可编辑 PPT。\n\n以下 4 个例子都是把对应 PMID 的原文 PDF 输入给 yixueAIganhuo-PPT skill 后得到的 PPTX 制作流程示例，每个例子仅展示 3 页。\n\n### PPT例子1：输入 [PMID 38133501](https:\u002F\u002Fpubmed.ncbi.nlm.nih.gov\u002F38133501\u002F) 原文 PDF 后的 PPTX 制作流程示例（仅展示 3 页）\n\n点击下图可查看完整例子。\n\n[![PPT例子1全自动制作流程](docs\u002Fassets\u002Fzh\u002Fsample_slide_pipelines\u002Fppt-example-1-pmid-38133501_sample_pipeline_zh.webp)](docs\u002Fexamples\u002Fzh\u002Fppt-example-1-pmid-38133501.md)\n\n### PPT例子2：输入 [PMID 41232598](https:\u002F\u002Fpubmed.ncbi.nlm.nih.gov\u002F41232598\u002F) 原文 PDF 后的 PPTX 制作流程示例（仅展示 3 页）\n\n点击下图可查看完整例子。\n\n[![PPT例子2全自动制作流程](docs\u002Fassets\u002Fzh\u002Fsample_slide_pipelines\u002Fppt-example-2-pmid-41232598_sample_pipeline_zh.webp)](docs\u002Fexamples\u002Fzh\u002Fppt-example-2-pmid-41232598.md)\n\n### PPT例子3：输入 [PMID 41167457](https:\u002F\u002Fpubmed.ncbi.nlm.nih.gov\u002F41167457\u002F) 原文 PDF 后的 PPTX 制作流程示例（仅展示 3 页）\n\n点击下图可查看完整例子。\n\n[![PPT例子3全自动制作流程](docs\u002Fassets\u002Fzh\u002Fsample_slide_pipelines\u002Fppt-example-3-pmid-41167457_sample_pipeline_zh.webp)](docs\u002Fexamples\u002Fzh\u002Fppt-example-3-pmid-41167457.md)\n\n### PPT例子4：输入 [PMID 41814259](https:\u002F\u002Fpubmed.ncbi.nlm.nih.gov\u002F41814259\u002F) 原文 PDF 后的 PPTX 制作流程示例（仅展示 3 页）\n\n点击下图可查看完整例子。\n\n[![PPT例子4全自动制作流程](docs\u002Fassets\u002Fzh\u002Fsample_slide_pipelines\u002Fppt-example-4-pmid-41814259_sample_pipeline_zh.webp)](docs\u002Fexamples\u002Fzh\u002Fppt-example-4-pmid-41814259.md)\n\n## 怎么安装\n\n推荐在 Codex、Claude Code 或其他支持 skills 的 agent 工具中，让 agent 帮你安装。**默认只需要拉取 skill 运行所需文件，不需要下载 README 展示图、docs、示例 PDF 和示例 PPTX。**\n\n可以直接复制下面这段话对 agent 说：\n\n```text\n请帮我安装 yixueAIganhuo-PPT skill。\n\n仓库地址：https:\u002F\u002Fgithub.com\u002Fsnowmanzhuang\u002FyixueAIganhuo-PPT.git\n\n请保存到你当前可用的 skills 目录中，并且只拉取 skill 运行所需文件：\n\nSKILL.md\nscripts\u002F\nreferences\u002F\nexamples\u002F\nrequirements.txt\n\n不要下载 docs、README 展示图、示例 PDF 和示例 PPTX。\n```\n\nPaddleOCR v5、图像生成 API、本地 CLIProxyAPI 等环境需要按你的电脑和 API 账号单独配置。第一次运行时，agent 可能会安装依赖、下载模型并确认 API 配置，通常需要 30 分钟到 1 小时，请保持网络稳定。\n\n图像生成选择建议：如果你在 Codex App \u002F Codex CLI 中运行，并且当前环境支持 subagent 和内置 `image_gen`，可以选择 Codex 内置生图路径，不需要额外图像 API key；该路径会把原始生成图归档到任务目录并标准化为 `2560x1440` 后再进入 PPTX 管线。如果你需要原生精确分辨率或更可控的 API 参数，有订阅制 OpenAI 时推荐使用 [CLIProxyAPI](https:\u002F\u002Fgithub.com\u002Frouter-for-me\u002FCLIProxyAPI)，否则推荐使用 [OpenRouter](https:\u002F\u002Fopenrouter.ai\u002F)。\n\n常用入口：\n\n- [CLIProxyAPI](https:\u002F\u002Fgithub.com\u002Frouter-for-me\u002FCLIProxyAPI)\n- [OpenRouter](https:\u002F\u002Fopenrouter.ai\u002F)\n- Codex 内置 image_gen（仅 Codex App \u002F Codex CLI 可用时显示）\n- PaddleOCR 设置说明：[中文](docs\u002Fsetup\u002Fpaddleocr.zh.md) \u002F [English](docs\u002Fsetup\u002Fpaddleocr.en.md)\n\n如果使用 PaddleOCR API，核心目标是拿到 AI Studio access token。后续 skill 需要远程 OCR 时，把 token 按提示填入即可。\n\n## 怎么让 agent 使用\n\n把这个仓库放到 Codex、Claude Code 或其他 agent 能读取的 skills 目录后，提问时说明“调用 yixueAIganhuo-PPT skill”，然后直接说要把什么材料制作成 PPT 即可。页数、语言、风格、API、OCR 环境等细节，skill 执行过程中会根据需要继续向你确认。\n\n```text\n请调用 yixueAIganhuo-PPT skill，把我提供的论文 PDF 做成文字可编辑的中文汇报 PPTX。\n```\n\n```text\n请调用 yixueAIganhuo-PPT skill，把这些课程资料和截图整理成一个适合课堂讲解的 PPTX。\n```\n\n```text\n请调用 yixueAIganhuo-PPT skill，我已经有图片型 PPTX \u002F 每页截图，只需要帮我转成可编辑 PPTX。\n```\n\n```text\n请调用 yixueAIganhuo-PPT skill，只生成图片型 PPTX，不需要转成可编辑 PPTX。\n```\n\n## 使用前请务必看\n\n> [!IMPORTANT]\n> 第一次使用建议先按下面的方式测试，不要一上来就跑很长、很复杂的任务。\n>\n> - **先小规模测试**：先做 3-5 页，不要一开始就跑 20 页以上。\n> - **先跑通环境**：先确认 API、OCR 和本地依赖能跑通，再逐步增加页数和材料复杂度。\n> - **保持网络稳定**：网络不稳定或 API 限流时，并发任务容易失败；长任务期间尽量保持网络通畅。\n> - **并发可以调整**：默认并发设置偏保守；电脑性能和 API 稳定后，可以让 agent 按配置逐步调高。\n> - **先让 agent 解释流程**：开始前可以让 agent 阅读 skill 并解释完整流程，这样中间出错时更容易判断是生图、OCR、清文字背景还是 PPTX 重建的问题。\n> - **允许必要微调**：最终 PPTX 的文字位置、字号、换行仍可能需要手动微调。\n> - **原图可手动覆盖**：如果某些原图被 OCR 转成文字或视觉上不够理想，可以在 PowerPoint 里手动把原图粘贴覆盖回去；默认策略是按原始比例嵌入图片，不主动拉伸变形。\n\n## 仓库内容\n\n```text\nSKILL.md                 # skill 主说明，agent 会优先读取\nscripts\u002F                 # 生成、OCR、清文字背景、PPTX 重建脚本\nreferences\u002F              # agent 使用的流程规则和 QA 规则，普通用户一般不需要直接阅读\nexamples\u002F                # manifest \u002F plan \u002F provider config \u002F style prompt 示例\ndocs\u002F                    # README 和 gallery 使用的展示图\n```\n\n## 许可\n\n本项目采用非商业使用许可，严禁商业用途。详见 [LICENSE](LICENSE)。\n\n## 更多医学 AI 教程\n\n我是“医学AI干货”的作者，主要分享面向医学学习、科研和临床汇报的 AI 工作流。除了这个 PPTX 制作 skill，公众号里也会持续整理更多实用教程，包括综述写作与参考文献整理、Meta 分析前期文献初筛、个性化文献追踪和推送、提示词优化、医学统计图生成、科研技术路线图绘制、图片数据录入等。欢迎扫码关注。\n\n\u003Cimg src=\"docs\u002Fassets\u002Freadme\u002Fyixue-ai-ganhuo-wechat-qrcode.jpg\" alt=\"医学AI干货 公众号二维码\" width=\"220\">\n","yixueAIganhuo-PPT 是一个基于 AI 的工作流，用于将论文、PDF、图表、截图等资料自动制作成高质量的 PPT，并可进一步重建为可编辑的 PPTX 文件。该项目利用 GPT Image 2 生成图片型 PPT，通过 PaddleOCR v5 识别并清除文字背景，最终添加可编辑文字层，生成包含原始比例嵌入的 Figure 和图表的 PPTX。它特别适用于论文精读、组会汇报、教学培训和日常汇报等场景。用户可以选择只生成图片型 PPT 或者进一步处理为可编辑版本，且支持在 PPTX 中保留演讲稿备注，方便后续使用。",2,"2026-06-11 03:31:42","CREATED_QUERY"]