getomni-ai

zerox

getomni-ai

OCR & Document Extraction using vision models

AI 简介

Zerox 是一个基于视觉模型的OCR和文档提取工具,能够将PDF、DOCX或图片等文件转换为Markdown格式。它通过将输入文件转化为一系列图像,并利用GPT等AI技术对每张图像进行处理,最终聚合输出Markdown文本。Zerox支持多种AI服务提供商(如OpenAI, Azure OpenAI, AWS Bedrock等),并提供了丰富的功能选项,包括并发处理、错误处理模式以及页面选择等。该项目适合需要从复杂布局文档中高效提取信息并转化为结构化数据的应用场景,比如自动化文档处理、知识管理平台等。

TypeScript
MIT License
12.2k
Stars
848
Forks
62
Watchers
70
Issues

Star 增长

今日+2
近 7 天+5
近 30 天+11
综合评分76.39
默认分支main