
PaddleOCR
PaddlePaddle
Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.
AI 简介
PaddlePaddle/PaddleOCR 是一个强大的轻量级 OCR 工具包,能够将 PDF 或图像文档转换为结构化数据,适用于 AI 应用。该项目支持超过 100 种语言,并且集成了多种功能,如文档解析、翻译和关键信息提取等。其核心技术基于 PaddlePaddle 深度学习框架,具备高性能与灵活性,支持 CPU、GPU 等多种硬件加速。PaddleOCR 适合需要从非结构化文本中提取信息的场景,例如文档自动化处理、多语言内容分析以及与其他大型语言模型集成的应用。
Python
Apache License 2.080.5k
Stars
10.6k
Forks
547
Watchers
140
Issues
Star 增长
今日+711
近 7 天+1473
近 30 天+3247
综合评分120
默认分支main