
OCRmyPDF
ocrmypdf
OCRmyPDF adds an OCR text layer to scanned PDF files, allowing them to be searched
AI 简介
OCRmyPDF 是一个用于给扫描的 PDF 文件添加可搜索文本层的工具。其核心功能包括使用 Tesseract OCR 引擎识别超过 100 种语言的文字,并将这些文字准确地放置在图像下方,以便于复制和粘贴。此外,它还能修正页面旋转、校正歪斜的文档、优化 PDF 图像大小,以及生成符合 PDF/A 标准的文件。该工具支持多核处理,可以高效处理大量页数的文件。OCRmyPDF 适用于需要将纸质文档或扫描件转换为可搜索电子文档的各种场景,如办公自动化、档案数字化等。
Python
Mozilla Public License 2.033.8k
Stars
2.3k
Forks
189
Watchers
111
Issues
Star 增长
今日+10
近 7 天+60
近 30 天+263
综合评分120
默认分支main