run-llama

ParseBench

run-llama

ParseBench - A Document Parsing Benchmark for AI Agents

AI 简介

ParseBench 是一个用于评估文档解析工具将PDF转换为结构化输出效果的基准测试平台,这些输出可以被AI代理可靠地使用。它主要测试解析后的输出是否保留了对自主决策至关重要的结构和意义,而不仅仅是与参考文本相似。项目基于Python开发,涵盖了约2000页来自真实企业文件(如保险、金融、政府等)的人工验证页面,并围绕五个能力维度进行组织,每个维度针对一种可能破坏生产代理工作流程的故障模式。ParseBench适用于需要高质量文档解析服务以支持复杂AI应用的企业场景,特别是在处理包含表格、图表及需保持内容准确性的文档时。

Python
Apache License 2.0
488
Stars
61
Forks
9
Watchers
2
Issues

Star 增长

今日0
近 7 天+8
近 30 天+13
综合评分50.68
默认分支main