UCSB-AI

HarnessAudit

UCSB-AI

Official codebase for the paper "Auditing Agent Harness Safety"

AI 简介

HarnessAudit 是一个用于审计代理系统是否遵守工具、资源和信息流边界的安全评估框架。它通过分析完整的执行轨迹而非仅最终答案来实现这一目标,支持多代理运行、单代理控制运行、状态域库、原生CLI套件以及使用大语言模型作为裁判进行任务完成度和动作有效性的评分。该项目采用Python编写,并提供了详细的文档与快速入门指南,适用于需要确保AI代理在执行任务时符合安全规范的场景,如开发测试环境下的多智能体系统安全性验证。

Python
MIT License
42
Stars
3
Forks
40
Watchers
0
Issues

Star 增长

今日0
近 7 天+2
近 30 天+2
综合评分43.01
默认分支main