hamelsmu

evals-skills

hamelsmu

Skills for AI Evals to compliment the course: AI Evals For Engineers & PMs

AI 简介

该项目提供了用于指导AI编码代理构建LLM评估的技能集,旨在帮助工程师和产品经理更好地进行AI评估。其核心功能包括对评估流程进行审计、错误分析、生成合成数据等,通过这些技能可以识别并解决常见的评估问题。技术特点上,项目支持Claude Code环境下的插件安装以及开放Skills CLI的使用,方便用户根据自身需求选择合适的安装方式。适用于需要对AI系统进行质量评估与优化的各种场景,特别是对于刚开始接触AI评估的新手来说非常友好。

MIT License
1.4k
Stars
142
Forks
14
Watchers
1
Issues

Star 增长

今日0
近 7 天+18
近 30 天+89
综合评分72.37
默认分支main