
WBench
meituan-longcat
WBench: A Comprehensive Multi-turn Benchmark for Interactive Video World Model Evaluation
AI 简介
WBench 是一个用于评估交互式视频世界模型的多轮综合基准。它通过5个维度和22个指标对20种视频世界模型进行全面评测,旨在帮助研究人员和开发者了解不同模型在各种任务中的表现。项目采用Python语言编写,具备强大的数据处理与分析能力,并提供了详细的评测结果和排行榜。适合需要对视频理解、生成及交互模型进行性能对比分析的研究场景或工业应用环境使用。
Python
MIT License130
Stars
4
Forks
2
Watchers
2
Issues
Star 增长
今日+2
近 7 天+7
近 30 天+37
综合评分53.3
默认分支main