
dots.ocr
rednote-hilab
Multilingual Document Layout Parsing in a Single Vision-Language Model
AI 简介
dots.ocr是一个基于单一视觉-语言模型的多语言文档布局解析工具。它不仅在标准多语言文档解析中达到了同类规模模型中的领先性能,还能将结构化图形(如图表)直接转换为SVG代码,并支持网页屏幕解析和场景文本识别。该项目使用Python开发,采用先进的深度学习技术,确保了高精度和广泛的适用性。适用于需要处理多种语言文档、图表转换及复杂图文信息提取的应用场景,比如自动化办公、教育资料数字化以及内容管理等领域。
Python
MIT License8.9k
Stars
798
Forks
52
Watchers
140
Issues
Star 增长
今日0
近 7 天+13
近 30 天+349
综合评分81.21
默认分支master