docling-project

docling

docling-project

Get your documents ready for gen AI

AI 简介

Docling 是一个用于文档处理和解析的工具,支持多种格式文件的转换,并能与生成式AI生态系统无缝集成。其核心功能包括对PDF、DOCX、PPTX、XLSX、HTML等常见文档类型的解析,尤其是对PDF文档有深入的理解能力,如页面布局分析、表格结构识别等。此外,Docling还提供了丰富的API接口,方便开发者将其整合到自己的应用程序中。此项目非常适合需要将不同格式文档转换为统一数据结构以便进一步处理或分析的应用场景,例如文档自动化处理、知识库构建等领域。

Python
MIT License
61.4k
Stars
4.3k
Forks
219
Watchers
863
Issues

Star 增长

今日+71
近 7 天+427
近 30 天+1835
综合评分120
默认分支main