opendatalab

DocLayout-YOLO

opendatalab

DocLayout-YOLO: Enhancing Document Layout Analysis through Diverse Synthetic Data and Global-to-Local Adaptive Perception

AI 简介

DocLayout-YOLO 是一个基于 YOLO-v10 的文档布局分析模型,旨在通过多样化的合成数据和全局到局部自适应感知来增强文档布局检测。该项目的核心功能包括利用 Mesh-candidate BestFit 方法生成大规模多样化合成文档数据集 DocSynth-300K,并在模型结构上引入了全局到局部可控性模块以实现跨尺度的精确检测。适合于需要实时且鲁棒地处理多种文档布局分析的应用场景,如文档信息提取、PDF 内容解析等。

Python
GNU Affero General Public License v3.0
2.2k
Stars
163
Forks
10
Watchers
50
Issues

Star 增长

今日+6
近 7 天+7
近 30 天+33
综合评分77.44
默认分支main