evals-skills

hamelsmu

Skills for AI Evals to compliment the course: AI Evals For Engineers & PMs

AI 简介

该项目提供了用于指导AI编码代理构建LLM评估的技能集，旨在帮助工程师和产品经理更好地进行AI评估。其核心功能包括对评估流程进行审计、错误分析、生成合成数据等，通过这些技能可以识别并解决常见的评估问题。技术特点上，项目支持Claude Code环境下的插件安装以及开放Skills CLI的使用，方便用户根据自身需求选择合适的安装方式。适用于需要对AI系统进行质量评估与优化的各种场景，特别是对于刚开始接触AI评估的新手来说非常友好。

MIT License

在 GitHub 查看官方网站

1.4k

Stars

142

Forks

Watchers

Issues

Star 增长

今日0

近 7 天+18

近 30 天+89

综合评分72.37

默认分支main