chi-bench

actava-ai

Χ-Bench: Can AI Agents Automate End-to-End, Long-Horizon, Policy-Rich Healthcare Workflows?

AI 简介

χ-Bench（Chi-Bench）是一个面向医疗健康领域的AI代理评估基准，用于测试AI系统在端到端、长周期、强政策约束的临床工作流中的自动化能力。其核心功能包括模拟美国医疗三大真实场景（医疗机构事前授权、保险方使用管理、人群健康管理），集成20个高保真医疗应用接口（通过MCP协议）、1279页《管理式医疗运营手册》知识库，并支持工具调用与结构化文档生成。技术特点涵盖政策驱动决策、多步骤任务编排、跨系统协同与真实临床案例驱动评估。适用于医疗AI代理研发、监管合规验证及健康信息化系统智能化升级等场景。

Python

Apache License 2.0

benchmark care-management healthcare-ai prior-authorization

在 GitHub 查看官方网站

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天+4

综合评分42.94

默认分支main

chi-bench

Star 增长

加入交流群