Giskard-AI

giskard-oss

Giskard-AI

🐢 Open-Source Evaluation & Testing library for LLM Agents

AI 简介

Giskard 是一个用于测试和评估代理系统的开源 Python 库。其核心功能包括模块化、轻量级的多轮次测试框架,支持动态及异步优先的设计理念,特别适用于大型语言模型(LLM)的安全性评估与红队攻击模拟。该工具集成了强大的AI漏洞扫描器,并增强了对检索增强生成(RAG)模型的评价能力,旨在为开发者提供全面而高效的测试解决方案。适用于需要确保AI系统安全可靠性的场景,如开发负责任且值得信赖的人工智能应用时。

Python
Apache License 2.0
5.4k
Stars
468
Forks
39
Watchers
33
Issues

Star 增长

今日+7
近 7 天+16
近 30 天+83
综合评分94.31
默认分支main