WBench

meituan-longcat

WBench: A Comprehensive Multi-turn Benchmark for Interactive Video World Model Evaluation

AI 简介

WBench 是一个用于评估交互式视频世界模型的多轮综合基准。它通过5个维度和22个指标对20种视频世界模型进行全面评测，旨在帮助研究人员和开发者了解不同模型在各种任务中的表现。项目采用Python语言编写，具备强大的数据处理与分析能力，并提供了详细的评测结果和排行榜。适合需要对视频理解、生成及交互模型进行性能对比分析的研究场景或工业应用环境使用。

Python

MIT License

在 GitHub 查看

130

Stars

Forks

Watchers

Issues

Star 增长

今日+2

近 7 天+7

近 30 天+37

综合评分53.3

默认分支main