
OCRFlux
chatdoc-com
OCRFlux is a lightweight yet powerful multimodal toolkit that significantly advances PDF-to-Markdown conversion, excelling in complex layout handling, complicated table parsing and cross-page content merging.
AI 简介
OCRFlux 是一个轻量级但功能强大的多模态工具包,专注于将PDF和图像转换为清晰易读的Markdown文本。其核心功能包括对复杂布局、复杂表格解析以及跨页内容合并的支持,能够自然地处理多列布局、图表和插图,并自动移除页眉和页脚。特别地,OCRFlux 在单页解析质量上超越了现有基线模型,在编辑距离相似度(EDS)指标上有显著提升;同时,它也是首个支持跨页表格/段落合并的开源项目之一。基于30亿参数的视觉语言模型,该工具可以在GTX 3090 GPU等设备上运行。适用于需要高质量PDF转Markdown转换的各种场景,如学术论文、技术文档处理等。
Python
Apache License 2.02.5k
Stars
151
Forks
17
Watchers
69
Issues
Star 增长
今日0
近 7 天0
近 30 天+18
综合评分60.35
默认分支main