kreuzberg-dev

kreuzberg

kreuzberg-dev

A polyglot document intelligence framework with a Rust core. Extract text, metadata, images, and structured information from PDFs, Office documents, images, and 97+ formats. Available for Rust, Python, Ruby, Java, Go, PHP, Elixir, C#, R, C, TypeScript (Node/Bun/Wasm/Deno)- or use via CLI, REST API, or MCP server.

AI 简介

Kreuzberg 是一个基于 Rust 的多语言文档智能处理框架,能够从 PDF、Office 文档、图片及 97 种以上格式中提取文本、元数据、图片和结构化信息。该项目支持多种编程语言绑定,包括 Rust、Python、Ruby、Java、Go、PHP、Elixir、C#、R、C 和 TypeScript(Node/Bun/WASM/Deno),同时提供 CLI、REST API 和 MCP 服务器等多种使用方式。Kreuzberg 适用于需要高效且跨平台地处理各种文档类型的场景,如企业内容管理、自动化办公流程、数据分析等。其强大的功能集合和广泛的兼容性使其成为现代文档处理解决方案的理想选择。

Rust
Other
8.5k
Stars
498
Forks
29
Watchers
13
Issues

Star 增长

今日+10
近 7 天+40
近 30 天+211
综合评分114.09
默认分支main