
agent-safety-eval-lab
YutoTerashima
Agent trace and tool-use safety evaluation lab.
AI 简介
Agent Safety Eval Lab 是一个用于评估大语言模型(LLM)代理系统安全性的实验室,专注于消息、工具调用、策略边界、轨迹和安全结果的分析。该项目的核心功能包括模拟模式运行、代理轨迹记录、工具策略评分及安全性评估,并生成风险报告。其技术特点在于支持多种模型适配器(如OpenAI、Hugging Face等),同时保持评估框架的一致性。适合需要深入理解或测试AI代理在特定任务中表现及其潜在风险的应用场景,比如开发安全合规的人工智能助手时使用。
Python
MIT License358
Stars
18
Forks
12
Watchers
0
Issues
Star 增长
今日0
近 7 天0
近 30 天+210
综合评分53.84
默认分支main