trust-eval-mm

ziyuwowo

Multi-dimensional trustworthiness evaluation for multimodal LLMs

AI 简介

TrustEval-MM 是一个面向多模态大语言模型（MLLM）的多维度可信度评估工具包。它从真实性、鲁棒性、公平性、校准性与隐私性五个维度，通过11个子任务对模型进行细粒度量化评估，并支持生成可解释的Markdown格式信任卡片。项目基于PyTorch与HuggingFace生态构建，提供命令行与Python API双接口，强调暴露模型在单一准确率指标下隐藏的风险模式。适用于AI研发团队在模型选型、安全合规审查及负责任部署前开展系统性可信度诊断。

Python

Other

在 GitHub 查看

129

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天0

综合评分42.71

默认分支main

trust-eval-mm

Star 增长

加入交流群