weavebench

WeaveBench

weavebench

WeaveBench: A Long-Horizon, Real-World Benchmark for Computer-Use Agents with Hybrid Interfaces

Python
MIT License
63
Stars
0
Forks
52
Watchers
1
Issues

Star 增长

今日0
近 7 天0
近 30 天0
综合评分36
默认分支main

暂无 README 内容

项目可能尚未同步完成,请稍后查看