ParseBench

run-llama

ParseBench - A Document Parsing Benchmark for AI Agents

AI 简介

ParseBench 是一个面向 AI 代理（AI Agents）的文档解析性能评测基准，用于量化评估 PDF 解析工具输出结构化结果的可靠性与可用性。它覆盖表格提取、图表理解、内容保真度、语义格式一致性及视觉定位五大能力维度，基于约 2000 页真实企业文档（保险、金融、政务等）构建，强调解析结果能否支撑下游自主决策而非仅文本相似性。项目提供标准化测试框架、Hugging Face 数据集及可复现的评估流水线，适用于文档智能系统研发、LLM 应用工程化验证及多模态模型在生产环境中的选型评估。

Python

Apache License 2.0

benchmark document-ai document-parsing evaluation llamaindex llm machine-learning ocr pdf-parsing table-extraction vision-language-models

在 GitHub 查看官方网站

514

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+7

综合评分50.25

默认分支main

ParseBench

Star 增长

加入交流群