ninehills

pdf2md

ninehills

PDF to Markdown OCR tools

AI 简介

ninehills/pdf2md 是一个将 PDF 文档转换为 Markdown 的命令行工具,支持三种视觉语言模型(VLM),通过本地 Docker 推理服务实现端到端的转换。项目采用纯 Go 语言编写,生成单一二进制文件,除了 Docker 和 GPU 外无其他系统依赖,易于部署和使用。它支持多种 OCR 模型,包括布局感知的 dots-ocr、阿里巴巴的 Logics-Parsing-v2 以及 PaddleOCR-VL-1.5 GGUF,并允许用户根据需求选择不同的模型进行转换。适用于需要将学术论文、技术文档等 PDF 格式的文件转换为更易于编辑和分享的 Markdown 格式的场景。

Go
MIT License
51
Stars
4
Forks
48
Watchers
7
Issues

Star 增长

今日0
近 7 天+1
近 30 天+3
综合评分42.9
默认分支master