RUC-NLPIR

Rubrics_Survey

RUC-NLPIR

暂无描述

AI 简介

这是一个面向大语言模型（LLM）评估与训练的评测标准综述项目，系统梳理了“评测量规”（rubrics）的研究进展。项目核心涵盖量规的形式化定义、与奖励模型等方法的对比分析，并分类整理了量规构建、用于模型训练及用于模型评估三大方向的技术路径，同时探讨奖励作弊、评估偏差、个性化适配与量规安全性等开放挑战。适用于LLM评测研究者、AI对齐工程师及需要结构化质量标准的模型开发团队。

在 GitHub 查看

227

Stars

0

Forks

106

Watchers

0

Issues

Star 增长

今日0

近 7 天0

近 30 天+10

综合评分35

默认分支main