open-compass

opencompass

open-compass

OpenCompass is an LLM evaluation platform, supporting a wide range of models (Llama3, Mistral, InternLM2,GPT-4,LLaMa2, Qwen,GLM, Claude, etc) over 100+ datasets.

AI 简介

OpenCompass 是一个大语言模型(LLM)评估平台,支持包括Llama3、Mistral、InternLM2、GPT-4、LLaMa2、Qwen、GLM、Claude等在内的多种模型,并覆盖超过100个数据集。其核心功能在于提供了一套全面的评估工具和算法,能够帮助用户轻松地测试和比较不同NLP模型的表现。该平台采用Python开发,具有良好的扩展性和易用性。适用于需要对大型语言模型进行性能评测的研究人员、开发者以及企业,在选择或优化模型时提供重要参考依据。

Python
Apache License 2.0
7.1k
Stars
788
Forks
28
Watchers
378
Issues

Star 增长

今日0
近 7 天+13
近 30 天+75
综合评分78.69
默认分支main