confident-ai

deepeval

confident-ai

The LLM Evaluation Framework

AI 简介

DeepEval是一个易于使用的开源LLM评估框架,专为大型语言模型系统的评估而设计。它提供了类似Pytest的单元测试功能,但专门针对LLM应用程序进行了优化。该框架集成了最新的研究成果,支持多种评估指标和特性,如准确性、一致性、偏见检测等。DeepEval适用于需要对AI生成内容进行质量控制和性能测试的各种场景,包括但不限于聊天机器人、文本生成服务和自动摘要工具。通过使用Python编写,DeepEval确保了良好的可移植性和易用性,同时其活跃的社区支持和丰富的文档资源使得开发者能够快速上手并集成到现有项目中。

Python
Apache License 2.0
16.1k
Stars
1.5k
Forks
62
Watchers
209
Issues

Star 增长

今日0
近 7 天+133
近 30 天+632
综合评分99.55
默认分支main