QuivrHQ

MegaParse

QuivrHQ

File Parser optimised for LLM Ingestion with no loss 🧠 Parse PDFs, Docx, PPTx in a format that is ideal for LLMs.

AI 简介

MegaParse 是一个专为大型语言模型(LLM)设计的文件解析工具,能够高效地处理 PDF、Docx 和 PPTx 等多种文档格式。其核心功能包括无信息损失的文档解析、快速高效的处理速度以及广泛的文件兼容性,支持文本、PDF、PowerPoint、Word 文档等多种格式。此外,MegaParse 还具备强大的表格、目录、页眉页脚和图片解析能力,并且是开源免费的。适用于需要将各种类型文档转换为适合 LLM 处理格式的场景,如知识管理、文档自动化处理等。

Python
Apache License 2.0
7.4k
Stars
420
Forks
34
Watchers
25
Issues

Star 增长

今日0
近 7 天0
近 30 天+16
综合评分45.47
默认分支main