meituan-longcat

WBench

meituan-longcat

WBench: A Comprehensive Multi-turn Benchmark for Interactive Video World Model Evaluation

AI 简介

WBench 是一个用于评估交互式视频世界模型的多轮综合基准。它通过5个维度和22个指标对20种视频世界模型进行全面评测,旨在帮助研究人员和开发者了解不同模型在各种任务中的表现。项目采用Python语言编写,具备强大的数据处理与分析能力,并提供了详细的评测结果和排行榜。适合需要对视频理解、生成及交互模型进行性能对比分析的研究场景或工业应用环境使用。

Python
MIT License
130
Stars
4
Forks
2
Watchers
2
Issues

Star 增长

今日+2
近 7 天+7
近 30 天+37
综合评分53.3
默认分支main