actava-ai

chi-bench

actava-ai

Χ-Bench: Can AI Agents Automate End-to-End, Long-Horizon, Policy-Rich Healthcare Workflows?

AI 简介

Χ-Bench是一个用于评估AI代理在端到端、长周期、政策丰富的美国医疗工作流程中表现的基准测试平台。它通过一个高保真的20个医疗应用程序模拟器,结合1,279文档的管理护理操作手册技能,来测试AI在提供者预授权、支付方利用管理和人群健康管理三个领域的任务执行能力。该项目采用Python开发,具备高度仿真环境和丰富文档支持,适用于研究和开发能够自动化复杂医疗业务流程的智能系统。

Python
Apache License 2.0
39
Stars
6
Forks
2
Watchers
1
Issues

Star 增长

今日0
近 7 天+1
近 30 天+4
综合评分43.44
默认分支main