lumina-ai-inc

chunkr

lumina-ai-inc

Vision infrastructure to turn complex documents into RAG/LLM-ready data

AI 简介

Chunkr 是一个用于将复杂文档转换为适合检索增强生成(RAG)和大语言模型(LLM)处理的数据的视觉基础设施。其核心功能包括文档布局分析、光学字符识别(OCR)、边界框标注以及结构化HTML与Markdown输出,支持PDF、PPT、Word文档及图像等多种格式。采用Rust语言开发,确保了高性能与安全性。适用于需要从非结构化文档中提取信息并进行后续自然语言处理的应用场景,如知识管理、内容自动化摘要或智能文档解析等。开源版本遵循AGPLv3许可证,并提供社区支持;同时也有基于专有模型的云服务选项以满足更高精度和企业级需求。

Rust
GNU Affero General Public License v3.0
2.9k
Stars
182
Forks
17
Watchers
11
Issues

Star 增长

今日+2
近 7 天+4
近 30 天+6
综合评分65.39
默认分支main