landing-ai

agentic-doc

landing-ai

Legacy Python library for Agentic Document Extraction (ADE). Use the landingai-ade library for all new projects.

AI 简介

Agentic Document Extraction (ADE) 是一个用于从复杂文档中提取结构化数据的Python库。它支持处理包含表格、图片和图表等元素的长文档,并返回带有精确元素位置的层次化JSON。其核心功能包括支持100页以上的PDF文件一次性处理、自动重试与分页处理以应对并发、超时和速率限制,以及提供边界框片段和可视化调试工具等辅助功能。适用于需要从大量或复杂的文档中高效提取信息的场景,如企业级文档管理、数据分析等领域。请注意,此库已不再维护,建议新项目使用landingai-ade库。

Python
Apache License 2.0
2.4k
Stars
259
Forks
29
Watchers
14
Issues

Star 增长

今日+1
近 7 天+3
近 30 天+4
综合评分63.14
默认分支main