opendatalab

MinerU-Popo

opendatalab

暂无描述

AI 简介

MinerU-Popo 是一个轻量级且通用的框架,用于OCR输出后的后处理,旨在填补页面级OCR解析与文档级语义结构之间的空白。其核心功能包括通过4B模型执行四个子任务:表格截断分析、文本截断分析、标题层级分析和图文关联分析。项目采用任务导向的数据引擎生成代表性训练数据并简化特定任务输入;利用动态分块和同步技术处理长文档以保持全局一致性;并通过文档丰富化结构构建树形结构、生成摘要及拆分长节点。此工具适用于需要提升OCR识别结果准确性和文档结构化程度的场景,如金融报告、法律文件等复杂文档的处理。

Python
MIT License
147
Stars
10
Forks
35
Watchers
3
Issues

Star 增长

今日0
近 7 天+27
近 30 天+67
综合评分59.74
默认分支master