ragas

vibrantlabsai

Supercharge Your LLM Application Evaluations 🚀

AI 简介

Ragas 是一个专为评估 LLM 应用（尤其是 RAG 系统）设计的开源评估框架。它提供客观、可量化的评估指标（如忠实度、答案相关性、上下文相关性等），支持基于 LLM 的自动化测试数据生成，并与 LangChain 等主流框架无缝集成。项目采用模块化设计，兼顾离线评估与生产环境反馈闭环构建。适用于需要对检索增强生成（RAG）、智能问答、对话系统等 LLM 应用进行质量验证、迭代优化和上线前验收的开发与运维场景。

Python

Apache License 2.0

evaluation llm llmops

在 GitHub 查看官方网站

14.7k

Stars

1.5k

Forks

Watchers

327

Issues

Star 增长

今日0

近 7 天0

近 30 天+155

综合评分79.56

默认分支main

ragas

Star 增长

加入交流群