[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-70477":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":9,"language":10,"languages":9,"totalLinesOfCode":9,"stars":11,"forks":12,"watchers":13,"openIssues":14,"contributorsCount":15,"subscribersCount":15,"size":15,"stars1d":16,"stars7d":17,"stars30d":18,"stars90d":15,"forks30d":15,"starsTrendScore":19,"compositeScore":20,"rankGlobal":9,"rankLanguage":9,"license":21,"archived":22,"fork":22,"defaultBranch":23,"hasWiki":24,"hasPages":22,"topics":25,"createdAt":9,"pushedAt":9,"updatedAt":26,"readmeContent":27,"aiSummary":28,"trendingCount":15,"starSnapshotCount":15,"syncStatus":29,"lastSyncTime":30,"discoverSource":31},70477,"huashu-md-html","alchaincyf\u002Fhuashu-md-html","alchaincyf","md\u002Fhtml 双向流水线 · 三个能力一站式：万物→md \u002F md→精美html \u002F html→md。封装 markitdown + Pandoc + html-to-markdown + trafilatura。4 套反 AI slop 主题。Claude Code skill.",null,"CSS",756,79,4,5,0,12,24,308,36,9.71,"MIT License",false,"main",true,[],"2026-06-12 02:02:34","\u003Cdiv align=\"center\">\n\n# huashu-md-html\n\n> *「md 是源代码，html \u002F docx 是产物。」*\n\n[![License: MIT](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-MIT-yellow.svg)](LICENSE)\n[![Agent-Agnostic](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FAgent-Agnostic-blueviolet)](https:\u002F\u002Fskills.sh)\n[![Skills](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002Fskills.sh-Compatible-green)](https:\u002F\u002Fskills.sh)\n\n\u003Cbr>\n\n**md\u002Fhtml\u002Fdocx 多向流水线 · 四个能力一站式：万物 → md · md → 精美 html · html → md · md → 出版社级 docx**\n\n\u003Cbr>\n\n把任意文件（PDF \u002F DOCX \u002F PPTX \u002F XLSX \u002F EPUB \u002F 图片 \u002F 音频 \u002F YouTube \u002F 网页 URL）转成干净的 markdown，再用 4 套精挑过的主题加工成出色的 html，或反过来把已发布的 html 拉回来归档成 md。需要给出版社\u002F编辑\u002F投稿系统时——一条命令把 md 加工成出版社级 docx，自动嵌图、加封面、做目录、配页眉页脚。\n\n每个能力都封装成一个命令，每套主题都过了反 AI slop 检查清单——没有紫渐变、没有 emoji 当图标、没有 `#0D1117` 深蓝底，配色克制，有出版社品位。\n\n```\nnpx skills add alchaincyf\u002Fhuashu-md-html\n```\n\n跨 agent 通用——Claude Code、Cursor、Codex、OpenClaw、Hermes 都能装。\n\n[看效果](#demo) · [装上就能用](#装上就能用) · [四个能力](#四个能力) · [4 套 html 主题](#4-套-html-主题) · [一条龙工作流](#一条龙工作流)\n\n\u003C\u002Fdiv>\n\n---\n\n## Demo\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"demos\u002Fv3-hara-hero.gif\" alt=\"huashu-md-html Hero · md 是源，html 是产物\" width=\"100%\">\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\u003Csub>\n  ▲ 20 秒 · Kenya Hara 极简风格 · md → 入·排·出 → html · 衬线 + 留白 + 一抹赤陶橙\u003Cbr>\n  👉 \u003Ca href=\"demos\u002Fv3-hara-hero.mp4\">下载 MP4（含 BGM · 850KB）\u003C\u002Fa>\n\u003C\u002Fsub>\u003C\u002Fp>\n\n\u003Cdetails>\n\u003Csummary>另一版风格预览（点开看 Pentagram 信息建筑派 · 18 秒）\u003C\u002Fsummary>\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"demos\u002Fv1-pentagram.gif\" alt=\"huashu-md-html · Pentagram 风格\" width=\"100%\">\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\u003Csub>\n  ▲ Pentagram 信息建筑派 · 象牙白 + 墨黑 + 辛辣红 · 大字号 sans + 12 列网格 + tabular nums\u003Cbr>\n  👉 \u003Ca href=\"demos\u002Fv1-pentagram.mp4\">下载 MP4（含 BGM · 2MB）\u003C\u002Fa>\n\u003C\u002Fsub>\u003C\u002Fp>\n\n\u003C\u002Fdetails>\n\n> 📌 **以上两段动画都是用 [huashu-design](https:\u002F\u002Fgithub.com\u002Falchaincyf\u002Fhuashu-design) skill 做的——作为本 skill 的宣传短片。** 同一个产品，两种视觉哲学，差异不来自模板而来自设计语言。\n\n---\n\n## 装上就能用\n\n```bash\nnpx skills add alchaincyf\u002Fhuashu-md-html\n```\n\n然后在 Claude Code 里直接说话：\n\n```\n「这个 PDF 转成 md」\n「把这篇 md 做成精美 html，用 article 主题」\n「这个博客 URL 转回 md，去掉导航和侧栏」\n「把这份 PPTX 转成 md，再用 reading 主题做成发布版」\n「把这些章节 md 做成一份出版社可审校的 docx」\n「这份稿子做成投稿用的 word，A4 规格」\n```\n\n没有按钮、没有面板、没有 GUI。\n\n---\n\n## 四个能力\n\n| 用户说什么 | 能力 | 底层工具 | 入口脚本 |\n|---|---|---|---|\n| 「PDF \u002F DOCX \u002F PPTX \u002F XLSX \u002F EPUB \u002F 图片 \u002F 音频 \u002F YouTube \u002F 网页 URL → md」 | **能力 1：万物 → md** | [microsoft\u002Fmarkitdown](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fmarkitdown) | `scripts\u002Fany_to_md.py` |\n| 「md → 精美 html \u002F 文章 \u002F 报告 \u002F 阅读模式」 | **能力 2：md → 精美 html** | [pandoc](https:\u002F\u002Fpandoc.org\u002F) + 4 套自调主题 | `scripts\u002Fmd_to_html.py` |\n| 「本地 html 或 URL → md \u002F 归档已发布的博客」 | **能力 3：html → md** | [html-to-markdown](https:\u002F\u002Fgithub.com\u002FGoldziher\u002Fhtml-to-markdown) + [trafilatura](https:\u002F\u002Fgithub.com\u002Fadbar\u002Ftrafilatura) | `scripts\u002Fhtml_to_md.py` |\n| 「md → 出版社审校 docx \u002F 投稿稿件 \u002F 纸质书定稿」 | **能力 4：md → 精美 docx** | [python-docx](https:\u002F\u002Fgithub.com\u002Fpython-openxml\u002Fpython-docx) + 出版社级排版预设 | `scripts\u002Fmd_to_docx.py` |\n\n**决策原则**：\n- 能力 1 产出的 md 可以直接喂给能力 2，组成「PDF → 精美阅读 html」一条龙\n- 能力 3 用于反向归档（把已发布的 html 拉回项目源）\n- 能力 4 是**出版终点**——给人类编辑\u002F出版社审校时用 docx，不要直接给 html 或 md，专业出版生态默认 docx\n\n### URL 输入的两条路径\n\nURL 既能走能力 1（markitdown）也能走能力 3（trafilatura），但产出质量差异巨大：\n\n| 页面类型 | 走哪个 | 原因 |\n|----------|--------|------|\n| **结构化页面**（产品详情、技术文档、API doc、证书页、电商商品页）| 能力 1（markitdown）| 保留 metadata、字段值、链接、标题层级 |\n| **正文类页面**（博客、新闻、Essay、长文）| 能力 3（trafilatura）| 自动去导航\u002F侧栏\u002F相关推荐\u002F广告，只留正文 |\n| **不确定** | 两个都跑一遍对比 | 看哪个对下游用途更合适 |\n\n**判断捷径**：URL 里的内容是「读」的还是「查」的？读 → 能力 3（去噪），查 → 能力 1（保信息）。\n\n---\n\n## 4 套 html 主题\n\n每套都过了反 AI slop 检查清单。自包含单 CSS，HTML 打开即用，不依赖外部 CDN。\n\n| 主题 | 哲学锚点 | 适合场景 |\n|------|---------|---------|\n| **article** | Tufte CSS 启发 · Pentagram 式信息建筑 | essay、博客、深度阅读、独立文章 |\n| **report** | 出版社白皮书风 · 多表格密度型 | 技术报告、调研、白皮书、产品文档 |\n| **reading** | Medium 风极简 · 单栏窄体大字 | 公众号转接、纯阅读、轻量分发 |\n| **interactive** | 长文档导航型 · 折叠 + 目录 + 边栏 | 橙皮书章节、技术书籍、长教程 |\n\n\u003Ctable>\n\u003Ctr>\n\u003Ctd width=\"50%\">\u003Cimg src=\"examples\u002Foutput\u002Farticle.png\" alt=\"article 主题预览\">\u003Cbr>\u003Csub>\u003Cb>article\u003C\u002Fb> · Tufte 风 · 衬线 + 边距笔记\u003C\u002Fsub>\u003C\u002Ftd>\n\u003Ctd width=\"50%\">\u003Cimg src=\"examples\u002Foutput\u002Freport.png\" alt=\"report 主题预览\">\u003Cbr>\u003Csub>\u003Cb>report\u003C\u002Fb> · 白皮书风 · 宽体多表格\u003C\u002Fsub>\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003Ctr>\n\u003Ctd width=\"50%\">\u003Cimg src=\"examples\u002Foutput\u002Freading.png\" alt=\"reading 主题预览\">\u003Cbr>\u003Csub>\u003Cb>reading\u003C\u002Fb> · Medium 风 · 单栏极简\u003C\u002Fsub>\u003C\u002Ftd>\n\u003Ctd width=\"50%\">\u003Cimg src=\"examples\u002Foutput\u002Finteractive.png\" alt=\"interactive 主题预览\">\u003Cbr>\u003Csub>\u003Cb>interactive\u003C\u002Fb> · 长文档 · 侧边栏 + 折叠目录\u003C\u002Fsub>\u003C\u002Ftd>\n\u003C\u002Ftr>\n\u003C\u002Ftable>\n\n### 排版底线（所有主题共享）\n\n```\n正文字体（中文）  PingFang SC, Source Han Serif, Noto Serif CJK\n正文字体（英文）  Inter, IBM Plex Sans, et-book\n代码字体         JetBrains Mono, Fira Code\n行高（中文）     1.75 - 1.85\n行高（英文）     1.6\n字号（桌面）     17 - 18px\n最大宽度（文章）  680 - 720px\n最大宽度（报告）  760 - 820px\n代码块底色       #F6F8FA（浅模式）\u002F #1F2428（深模式）\n引用块           左 4px 色条 + 浅灰底\n```\n\n**禁用清单**：紫渐变、赛博霓虹、`#0D1117` 深蓝底、Comic Sans、emoji 作正式图标。\n\n---\n\n## md → 出版社级 docx\n\n为什么单独做能力 4？因为 `pandoc md -o docx` 出来的 docx 默认 Calibri、无表格样式、无封面、章节首页平淡——能给 AI 看，不能给出版社编辑改稿。\n\n能力 4 的脚本内置了出版社版式预设：\n\n```bash\n# 单文件转换\npython3 scripts\u002Fmd_to_docx.py article.md\n\n# 整本书（自动加封面 + 目录 + 页眉 + 章节分页）\npython3 scripts\u002Fmd_to_docx.py ch*.md postscript.md appendix.md --book \\\n    --title \"图解 Agent Skills\" \\\n    --subtitle \"让 AI 记住你的工作方式\" \\\n    --author \"花叔\" \\\n    --images-dir .\u002Fimages \\\n    -o book.docx\n```\n\n**版式特性**：\n\n| 元素 | 预设 |\n|------|------|\n| 页面 | 大 32 开（176×240mm）或 A4 |\n| 章标题 | 章号小标 + 24pt 大字号 + 橙色底分隔线 + 英文副标题 |\n| 引用块 | 按 emoji 自动配色：💡 琥珀 \u002F ✅ 青色 \u002F ⚠️ 玫红 |\n| 代码块 | 浅灰底 + 橙色左侧色边 + JetBrains Mono |\n| 表格 | 表头底色 + 灰色边框 + 居中对齐 |\n| 配图 | 居中嵌入 + 灰色斜体图说 |\n| 页眉页脚 | 书名右对齐 + 居中自动页码 |\n\n**实战验证**：用这个脚本生成《图解 Agent Skills》158 页出版社审校稿（9 章 + 后记 + 附录 + 57 张配图），一条命令搞定。\n\n完整 cookbook 见 [`references\u002Fmd-to-docx-cookbook.md`](references\u002Fmd-to-docx-cookbook.md)。\n\n依赖：`python3 -m pip install python-docx Pillow`\n\n---\n\n## 一条龙工作流\n\n```bash\n# 场景 1：PDF 白皮书 → 精美阅读 html\npython3 scripts\u002Fany_to_md.py whitepaper.pdf -o whitepaper.md\npython3 scripts\u002Fmd_to_html.py whitepaper.md --theme report -o whitepaper.html\n\n# 场景 2：YouTube 视频 → 文章博客\npython3 scripts\u002Fany_to_md.py \"https:\u002F\u002Fyoutube.com\u002Fwatch?v=xxx\" -o video.md\n# 编辑 video.md...\npython3 scripts\u002Fmd_to_html.py video.md --theme article -o blog.html\n\n# 场景 3：归档已发布的博客文章 → 项目源 md\npython3 scripts\u002Fhtml_to_md.py \"https:\u002F\u002Fexample.com\u002Fblog\u002Farticle\" -o article.md\n\n# 场景 4：抓产品页 \u002F 技术文档 → 完整结构化 md\npython3 scripts\u002Fany_to_md.py \"https:\u002F\u002Flearn.microsoft.com\u002Fen-us\u002Fsome-doc\" -o doc.md\n\n# 场景 5：橙皮书章节 → 多主题对比\npython3 scripts\u002Fmd_to_html.py chapter.md --theme article -o ch-article.html\npython3 scripts\u002Fmd_to_html.py chapter.md --theme interactive -o ch-interactive.html\n\n# 场景 6：URL 不确定走哪条路 → 两个都跑对比\npython3 scripts\u002Fany_to_md.py \"https:\u002F\u002Fexample.com\u002Fpage\" -o page-markitdown.md\npython3 scripts\u002Fhtml_to_md.py \"https:\u002F\u002Fexample.com\u002Fpage\" -o page-trafilatura.md\n\n# 场景 7：整本书 md → 出版社审校 docx\npython3 scripts\u002Fmd_to_docx.py md-v2\u002Fch*.md md-v2\u002Fpostscript.md md-v2\u002Fappendix.md --book \\\n    --title \"图解 Agent Skills\" --author \"花叔\" --subtitle \"让 AI 记住你的工作方式\" \\\n    --images-dir .\u002Fimages-v2 -o 出版社审校版.docx\n\n# 场景 8：PDF 论文 → docx 投稿（能力 1 → 能力 4）\npython3 scripts\u002Fany_to_md.py paper.pdf -o paper.md\n# 编辑 paper.md 修正格式...\npython3 scripts\u002Fmd_to_docx.py paper.md --page-size a4 -o paper.docx\n```\n\n---\n\n## 依赖\n\n| 工具 | 用途 | 安装 |\n|------|------|------|\n| `markitdown` | 万物 → md | `python3 -m pip install 'markitdown[all]'` |\n| `pandoc` | md → html | `brew install pandoc`（macOS）\u002F [官网下载](https:\u002F\u002Fpandoc.org\u002Finstalling.html) |\n| `html-to-markdown` | html → md（高速 Rust 引擎）| `python3 -m pip install html-to-markdown` |\n| `trafilatura` | URL 正文提取 | `python3 -m pip install trafilatura` |\n| `python-docx` + `Pillow` | md → 精美 docx | `python3 -m pip install python-docx Pillow` |\n\n脚本启动时会自检，缺失的依赖会明确提示安装命令，不会静默失败。\n\n> ⚠️ **macOS Python 环境陷阱**：`pip` 和 `python3` 可能指向不同的 Python 版本（实测踩过：`pip` 是 3.11、`python3` 是 3.14）。安装依赖请用 `python3 -m pip install ...`，不要直接 `pip install`。\n\n---\n\n## 仓库结构\n\n```\nhuashu-md-html\u002F\n├── SKILL.md                 # Agent 主文档（中文）\n├── README.md                # 本文件\n├── scripts\u002F                 # 四能力入口\n│   ├── any_to_md.py         # 能力 1：万物 → md\n│   ├── md_to_html.py        # 能力 2：md → 精美 html\n│   ├── html_to_md.py        # 能力 3：html → md\n│   └── md_to_docx.py        # 能力 4：md → 出版社级 docx\n├── templates\u002F               # 4 套精挑 html 主题 + 公众号专用\n│   ├── article\u002F             # Tufte 风\n│   ├── report\u002F              # 白皮书风\n│   ├── reading\u002F             # Medium 极简\n│   ├── interactive\u002F         # 长文档导航\n│   └── wechat\u002F              # 公众号转接\n├── references\u002F              # 按任务深入文档（中文）\n│   ├── markitdown-cookbook.md\n│   ├── md-to-html-themes.md\n│   ├── html-to-md-cookbook.md\n│   ├── md-to-docx-cookbook.md     # ⭐ 新增：md → docx 完整指南\n│   ├── design-tokens.md\n│   └── anti-ai-slop.md\n├── examples\u002F                # 主题预览\n│   ├── input\u002Fmd-vs-html.md\n│   └── output\u002F{article,report,reading,interactive}.{html,png}\n├── demos\u002F                   # README 引用的宣传动画\n│   ├── v3-hara-hero.{gif,mp4}     # Kenya Hara 极简\n│   └── v1-pentagram.{gif,mp4}      # Pentagram 信息建筑\n└── requirements.txt\n```\n\n---\n\n## 设计哲学\n\n这个 skill 的存在源于一个简单观察：**AI 时代，文档的「生产格式」和「消费格式」第一次解耦了。**\n\n写作发生在 markdown——可 diff、AI 友好、版本可控。\n分发发生在 html——排版精致、可分享、可导航。\n来回切换不应该有成本。\n\n大多数「转 X 到 Y」工具优化的是「转换保真度」。这个 skill 优化的是**写作者的循环**：\n\n- 一份 md 是源——所有创作和编辑都在 md 里\n- 多套 html 是产物——按场景挑主题，渲染一份精美的 html\n- 来回往返不丢结构——把已发布的博客拉回项目源，或者把别人的好内容归档成 md\n\n继承自 [huashu-design](https:\u002F\u002Fgithub.com\u002Falchaincyf\u002Fhuashu-design) 的反 AI slop 审美底线——4 套主题各有一个克制的强调色和一个出版级的排印签名，看起来像出版社做的，不像 SaaS 落地页。\n\n---\n\n## License\n\nMIT License — 个人和商业使用均自由，无需授权。\n\n如果这个 skill 对你有帮助，欢迎 star 仓库；如果你做了有意思的衍生作品（新主题、新格式支持），欢迎 PR。\n\n---\n\n## 联系花叔（Huasheng）\n\n花叔是 AI Native Coder、独立开发者、AI 自媒体博主。代表作：小猫补光灯（App Store 付费榜 Top 1）、《一本书玩转 DeepSeek》、[nuwa-skill](https:\u002F\u002Fgithub.com\u002Falchaincyf\u002Fnuwa-skill)（GitHub 12k+ stars）、[huashu-design](https:\u002F\u002Fgithub.com\u002Falchaincyf\u002Fhuashu-design)。全平台累计粉丝 30 万+。\n\n| 平台 | 账号 | 链接 |\n|------|------|------|\n| X \u002F Twitter | @AlchainHust | https:\u002F\u002Fx.com\u002FAlchainHust |\n| 公众号 | 花叔 | 微信搜索「花叔」 |\n| B 站 | 花叔 | https:\u002F\u002Fspace.bilibili.com\u002F14097567 |\n| YouTube | 花叔 | https:\u002F\u002Fwww.youtube.com\u002F@Alchain |\n| 小红书 | 花叔 | https:\u002F\u002Fwww.xiaohongshu.com\u002Fuser\u002Fprofile\u002F5abc6f17e8ac2b109179dfdf |\n| 官网 | huasheng.ai | https:\u002F\u002Fwww.huasheng.ai\u002F |\n| 开发者 Hub | bookai.top | https:\u002F\u002Fbookai.top |\n\n商业合作、内容定制、咨询，请发邮件到 **alchaincyf@gmail.com** 或私信任一社交平台。\n","huashu-md-html 是一个用于 md 和 html 双向转换的多向流水线工具，支持将任意文件（如 PDF、DOCX、PPTX、网页 URL 等）转换为 markdown，并进一步加工成精美的 html 或出版社级的 docx。其核心功能包括万物转 md、md 转精美 html、html 转 md 以及 md 转出版社级 docx。项目封装了多种开源工具如 markitdown、Pandoc 和 trafilatura，并提供了四套经过精心设计的主题，确保输出文档符合专业出版标准。适用于需要频繁处理文档格式转换和美化的工作场景，比如学术研究、技术写作或内容创作等。",2,"2026-06-11 03:32:30","CREATED_QUERY"]