RUC-NLPIR

Rubrics_Survey

RUC-NLPIR

暂无描述

AI 简介

该项目旨在通过制定和研究评分标准(Rubrics)来评估大型语言模型的质量。核心功能包括构建、训练及评估大型语言模型时所使用的多维度质量标准,如事实性、完整性、安全性、推理合理性、证据支持度以及实用性等,并将现有工作归纳为评分标准构建、用于模型训练的评分标准以及用于评估的评分标准三个方向。此外,项目还探讨了奖励机制滥用、评估偏见、个性化需求及评分标准安全性等开放性挑战。适合于从事自然语言处理特别是关注大模型开发与应用的研究人员和技术团队使用。

189
Stars
0
Forks
106
Watchers
0
Issues

Star 增长

今日0
近 7 天+12
近 30 天+71
综合评分47.1
默认分支main