[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-76399":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":9,"language":10,"languages":9,"totalLinesOfCode":9,"stars":11,"forks":12,"watchers":13,"openIssues":14,"contributorsCount":14,"subscribersCount":14,"size":14,"stars1d":15,"stars7d":16,"stars30d":17,"stars90d":14,"forks30d":14,"starsTrendScore":18,"compositeScore":19,"rankGlobal":9,"rankLanguage":9,"license":20,"archived":21,"fork":21,"defaultBranch":22,"hasWiki":23,"hasPages":21,"topics":24,"createdAt":9,"pushedAt":9,"updatedAt":25,"readmeContent":26,"aiSummary":27,"trendingCount":14,"starSnapshotCount":14,"syncStatus":28,"lastSyncTime":29,"discoverSource":30},76399,"codex-ppt-skill","Ronnie2025\u002Fcodex-ppt-skill","Ronnie2025","面向中文 toB 商业汇报的 Codex PPT 生图、元素重组与 SVG 拆解工作流",null,"Python",157,10,44,0,17,26,111,51,86.12,"MIT License",false,"main",true,[],"2026-06-12 04:01:21","# Codex PPT Skill\n\n面向中文 toB 商业汇报的 Codex PPT 工作流 skill：既可以生成高视觉图片型 PPT，也可以把图片页、截图页、整页生图页拆成更可编辑的 PowerPoint。\n\n它不是一个一键万能 PPT SaaS，而是一套给 Codex 使用的工作流和工具箱。重点是把 PPT 生成、图片页封装、元素重组、SVG 拆解这些路径分清楚，让用户知道什么时候该追求视觉效果，什么时候该追求可编辑性。\n\n## 文件说明\n\n- `README.md`：给 GitHub 访问者看的项目说明，重点讲能做什么、怎么选择路径、怎么安装和验证。\n- `SKILL.md`：给 Codex 执行用的路由手册，重点讲如何判断输入、选择流程、产出文件和做 QA。\n- `references\u002F`：放更细的执行边界、提示词结构、局限性和公开发布规则。\n- `scripts\u002F`：放可直接运行的封装、切图、对比和校验工具。\n\n![项目流程图](.\u002Fassets\u002Fworkflow\u002Fcodex-ppt-skill-decision-flow.png)\n\n## 使用顺序\n\n先看输入来源，再决定要不要进入拆解：\n\n- 新做 PPT 汇报：先走路径 A，生成图片型 PPT；如果只需要汇报展示，到 PPTX \u002F PDF \u002F PNG 就结束。\n- 已经有图片页、截图页、旧 PPT 渲染页：可以直接进入 PPT 拆解。\n- 路径 A 生成后的页图，如果后续需要编辑或复用，也可以继续交给 PPT 拆解。\n- 拆解时，要 PowerPoint 内可编辑 PPTX，优先选路径 B 元素重组；只要 SVG、文档\u002F网页复用或低成本结构样板，再选路径 C SVG 拆解。\n\n| 路径 | 适合目标 | 最终交付 | 关键边界 |\n|---|---|---|---|\n| A 整页生图 PPT | 新做方案汇报、售前材料、培训讲解、复盘展示，优先看起来好 | PPTX \u002F PDF \u002F PNG \u002F 汇总预览图 \u002F 逐页提示词 | 正文、图表和版式在图片里，不承诺全元素可编辑 |\n| B 元素重组 | 已有图片页或 A 生成的页图，要重建为实用级可编辑 PPTX | 可编辑 PPTX \u002F asset_manifest \u002F 验证报告 \u002F 渲染差异图 | 原图只做参考，不能把整页原图或原图硬裁片当最终素材 |\n| C SVG 拆解 | 已有图片页或 A 生成的页图，只要 SVG、文档\u002F网页复用或低成本结构样板 | SVG \u002F SVG 预览 \u002F 可选 PPTX 嵌入 | SVG 导入 PowerPoint 后未必保持内部对象稳定可编辑，不能当成完整 PPT 反编译 |\n\n## 模块一：PPT 生成\n\n这个模块解决的是：**从文档、旧 PPT、截图、图片页或业务目标出发，生成一套视觉完整的图片型 PPT。**\n\n适合只需要汇报展示、PDF 发送、PNG 预览或一次性交付的场景。它追求的是页面完成度和视觉稳定性，不承诺每个文字、图表、图标都能在 PowerPoint 里单独编辑。\n\n### 生成效果\n\n![风险升级路径](.\u002Fassets\u002Fexamples\u002F01-risk-evolution.png)\n\n| 框架页 | 矩阵页 |\n|---|---|\n| ![风险框架](.\u002Fassets\u002Fexamples\u002F02-risk-framework.png) | ![优先级矩阵](.\u002Fassets\u002Fexamples\u002F03-priority-matrix.png) |\n\n| 评测体系 | 闭环流程 | 路线图 |\n|---|---|---|\n| ![评测体系](.\u002Fassets\u002Fexamples\u002F04-evaluation-system.png) | ![闭环流程](.\u002Fassets\u002Fexamples\u002F05-closed-loop.png) | ![路线图](.\u002Fassets\u002Fexamples\u002F06-roadmap.png) |\n\n### 生成流程\n\n1. 让 Codex 根据材料输出页纲和逐页详细生图提示词。\n2. 用 imagegen 生成每页 16:9 整页图。\n3. 真实 Logo、二维码、印章、品牌标识只在后处理叠加，不交给 imagegen 生成。\n4. 用 `make pack` 或 `scripts\u002Fpackage_image_deck.py` 统一裁切、叠 Logo、封装 PPTX。\n5. 导出 PDF 和汇总预览图做视觉 QA。\n6. 若后续需要可编辑 PPTX 或 SVG，把最终页图作为 PPT 拆解模块的参考输入。\n\n### 生成 PPT 图片的小 tip\n\n逐页生图提示词建议固定包含：页面标题、页面目标、核心文字、版式结构、视觉元素、风格提示词、Logo 规则和负向约束。\n\n每页只保留一个中心主张，核心文字控制在 2-4 组；画面按 16:9 设计，中文要大而清晰。真实 Logo、二维码、印章和合规标识不要交给 imagegen 生成，统一在后处理阶段叠加。\n\n## 模块二：PPT 拆解\n\n这个模块解决的是：**已经有图片页、截图页或路径 A 生成的页图，但后续还需要继续编辑、复用或结构化。**\n\n拆解不是只有一种做法。需要 PowerPoint 内继续编辑时，优先选元素重组；只需要 SVG、网页\u002F文档复用，或低成本验证结构时，选 SVG 拆解。\n\n### 两种拆解方式\n\n| 方式 | 什么时候选 | 时间与 token | 大概还原度 |\n|---|---|---|---|\n| 元素重组 | 要在 PPTX 里继续改文字、移动形状、替换图标和装饰 | 单页约 10 分钟，约 8-25 万 tokens | 视觉还原约 75%-90%，PPTX 可编辑性更高 |\n| SVG 拆解 | 只要 SVG \u002F PNG 预览，或用于网页、文档、轻量结构样板 | 单页约 5 分钟，约 1-6 万 tokens | 结构还原约 65%-85%，复杂视觉会简化，PPT 内对象级编辑不稳定 |\n\n这些区间按复杂中文商业汇报页估算，实际会受页面复杂度、重抽次数、资产数量和 QA 标准影响，不是固定承诺。\n\n### 拆解效果\n\n| 元素重组：面向可编辑 PPTX | SVG 拆解：面向轻量结构复用 |\n|---|---|\n| ![元素重组效果](.\u002Fassets\u002Fexamples\u002Fdecompose-element-rebuild.png) | ![SVG 拆解效果](.\u002Fassets\u002Fexamples\u002Fdecompose-svg-redraw.png) |\n\n### 元素重组流程\n\n1. 以原始截图、图片页或路径 A 生成的页图为参考，建立 `visual_inventory.json`，把页面拆成文字、容器、图标、箭头、装饰、3D 元素、风险标记等对象。\n2. 建立 `asset_anchors.json`，记录每个待生成元素的 bbox、含义、目标尺寸和层级。\n3. 用 imagegen\u002FAPI 根据整页参考图和局部上下文生成 isolated asset grid。要求无文字、无数字、无标签、无卡片框、无背景碎片。\n4. 用 `make cut` 或 `scripts\u002Fgrid_cut.py` 切成一个元素一个透明 PNG。\n5. 用 PPT 原生文本框、形状、容器重建信息层；用透明资产插入图标、箭头、3D 装饰。\n6. 渲染 PPTX，使用 `make compare` 生成汇总预览图和差异热力图。\n7. 用 `make validate` 检查没有整页原图、没有参考图 hash、没有原图硬裁片媒体，并输出验证报告。\n\n### SVG 拆解流程\n\n1. 适合信息图、流程页、图标线框页、结构较清晰的截图页，也适合接收路径 A 生成的页图。\n2. Codex 读取参考图，按文本、容器、图标、箭头、背景结构重新写 SVG。\n3. 输出 SVG 和 PNG 预览，用于网页、文档或后续手工导入。\n4. 注意：SVG 导入 PowerPoint 后通常是图形对象或媒体对象，不等于所有内部路径都能稳定编辑。若目标是 PowerPoint 内对象级编辑，优先走元素重组。\n\n## 适合什么场景\n\n适合：\n\n- Codex 中使用 `$imagegen-scene-ppt` 做中文商业汇报、产品方案、行业趋势、风险治理、路线图类材料。\n- 用户只需要一份视觉强、可展示的 PPTX\u002FPDF，不需要后续逐字编辑。\n- 用户已有图片版 PPT、截图页或整页生图页，希望拆成更可维护的 PPTX 或 SVG。\n- 用户想锤炼图片页转 PPT 的流程，愿意保留 inventory、manifest、diff、QA 报告。\n\n不适合：\n\n- 大量 Excel 表、财务留档、合同正文、法规原文、密集脚注。\n- 要求任意图片一键变成完全原生、完全可编辑、像素级一致的 PPT。\n- 需要多人长期维护的企业模板库。\n- 不允许生成图、不允许人工 QA、也不接受已知限制的交付。\n\n## 安装\n\n安装到 Codex skill 目录：\n\n```bash\nmkdir -p ~\u002F.codex\u002Fskills\ngit clone https:\u002F\u002Fgithub.com\u002FRonnie2025\u002Fcodex-ppt-skill.git ~\u002F.codex\u002Fskills\u002Fimagegen-scene-ppt\n```\n\n这里目录名使用 `imagegen-scene-ppt` 是为了和 `SKILL.md` 里的触发名保持一致；仓库名仍然是 `codex-ppt-skill`。\n\n已经安装过时更新：\n\n```bash\ncd ~\u002F.codex\u002Fskills\u002Fimagegen-scene-ppt\ngit pull\n```\n\n安装后重启 Codex。触发名是：\n\n```text\n$imagegen-scene-ppt\n```\n\n示例请求：\n\n```text\n使用 $imagegen-scene-ppt 帮我做一份 toB 商业汇报 PPT，优先整页生图，最终要 PPTX 和 PDF。\n```\n\n```text\n使用 $imagegen-scene-ppt 把这几张图片页拆成可编辑 PPT。不要用整页原图铺底，图标和箭头按元素重组方式生成后再组装。\n```\n\n## 快捷命令\n\n仓库提供 `Makefile`，用于少打长命令。先把依赖安装到 `make` 实际使用的 Python 里：\n\n```bash\npython3 -m pip install -r requirements.txt\n```\n\n如果想避免本机 Python 环境混乱，可以用虚拟环境：\n\n```bash\npython3 -m venv .venv\n. .venv\u002Fbin\u002Factivate\npython -m pip install -r requirements.txt\nmake PYTHON=.venv\u002Fbin\u002Fpython check\nmake PYTHON=.venv\u002Fbin\u002Fpython demo\n```\n\n常用检查：\n\n```bash\nmake help\nmake check\n```\n\n完整命令列表以 `make help` 为准。\n\n整页图片封装为 PPTX：\n\n```bash\nmake pack IMAGES_DIR=.\u002Foutput\u002Fraw-slides OUT_PPTX=.\u002Foutput\u002Fdeck.pptx PACK_ARGS=\"--contact-sheet .\u002Foutput\u002Fcontact-sheet.jpg --export-pdf\"\n```\n\n资产网格切分为透明 PNG：\n\n```bash\nmake cut GRID=.\u002Foutput\u002Fgenerated\u002Ficons_grid.png ROWS=3 COLS=4 NAMES=icon_01,icon_02,icon_03,icon_04,icon_05,icon_06,icon_07,icon_08,icon_09,icon_10,icon_11,icon_12 OUT_DIR=.\u002Foutput\u002Fassets MANIFEST=.\u002Foutput\u002Fasset_manifest.json\n```\n\n参考图和渲染图对比：\n\n```bash\nmake compare REF=.\u002Foutput\u002Freference\u002Fpage-01.png RENDER=.\u002Foutput\u002Frender\u002Fpage-01.png COMPARE_DIR=.\u002Foutput\u002Fcompare\n```\n\n元素重组 PPTX 校验：\n\n```bash\nmake validate PPTX=.\u002Foutput\u002Freconstructed.pptx REF=.\u002Foutput\u002Freference\u002Fpage-01.png MANIFEST=.\u002Foutput\u002Fasset_manifest.json INVENTORY=.\u002Foutput\u002Fvisual_inventory.json REPORT=.\u002Foutput\u002Fvalidation_report.md\n```\n\n内置演示命令会写入 `output\u002Fdemo\u002F`，用于确认本机工具链可跑：\n\n```bash\nmake demo\nmake pack-demo\nmake cut-demo\nmake compare-demo\n```\n\n## 脚本工具\n\n| 脚本 | 作用 |\n|---|---|\n| `scripts\u002Fpackage_image_deck.py` | 将整页图片统一裁切为 16:9，叠加真实 Logo，封装为 PPTX，可选导出 PDF 和汇总预览图 |\n| `scripts\u002Fgrid_cut.py` | 将 imagegen 生成的 asset grid 切成单个透明 PNG，并生成 `asset_manifest.json` |\n| `scripts\u002Fcompare_render.py` | 将参考图和渲染图生成差异热区、指标和汇总预览图 |\n| `scripts\u002Fvalidate_semantic_deck.py` | 检查 PPTX 是否嵌入参考图、整页媒体或不合规 manifest |\n| `scripts\u002Faudit_pptx_editability.py` | 快速判断 PPTX 是否像图片页、是否混合文字与图片、是否含 SVG 媒体 |\n\n## 仓库结构\n\n```text\ncodex-ppt-skill\u002F\n├── SKILL.md\n├── README.md\n├── Makefile\n├── agents\u002F\n│   └── openai.yaml\n├── assets\u002F\n│   ├── examples\u002F\n│   └── workflow\u002F\n├── references\u002F\n│   ├── limitations.md\n│   ├── prompt-patterns.md\n│   ├── publication-boundaries.md\n│   └── semantic-replica-workflow.md\n├── scripts\u002F\n│   ├── audit_pptx_editability.py\n│   ├── audit_public_skill.py\n│   ├── compare_render.py\n│   ├── grid_cut.py\n│   ├── package_image_deck.py\n│   └── validate_semantic_deck.py\n└── templates\u002F\n    ├── asset_manifest.example.json\n    ├── conversion_report.template.md\n    └── visual_inventory.example.json\n```\n\n## 设计原则\n\n- 新做 PPT 汇报先生成图片型 PPT；已有图片页或 A 生成的页图，才进入元素重组或 SVG 拆解。\n- 图片型 PPT、可编辑 PPTX、SVG 是三种不同承诺。\n- 不把图片型 PPT 说成可编辑 PPT。\n- 不把整页截图、局部原图硬裁片、带残字的裁片当成最终可编辑重建资产。\n- 复杂图标、箭头、3D 元素、UI 装饰应拆成独立元素，再生成透明资产。\n- 中文文字、数字、来源、Logo、二维码、合规标识优先用后处理或 PPT 原生对象处理。\n- 每次交付都保留提示词、预览、对比、验证报告和已知限制。\n\n## License\n\nMIT\n","Codex PPT Skill 是一个面向中文 toB 商业汇报的 PPT 工作流工具，支持生成高视觉效果的图片型 PPT 以及将图片页、截图页和整页生图页拆解为更可编辑的 PowerPoint。其核心功能包括 PPT 生成、图片页封装、元素重组与 SVG 拆解，通过 Python 实现。该工具适用于需要高质量视觉展示且后续可能需要编辑或复用 PPT 的商业场景，如方案汇报、售前材料制作等。它提供多种路径选择，用户可以根据实际需求决定追求视觉效果还是可编辑性，从而灵活应对不同工作流程。",2,"2026-06-11 03:55:00","CREATED_QUERY"]