
Video-ChatGPT
mbzuai-oryx
[ACL 2024 🔥] Video-ChatGPT is a video conversation model capable of generating meaningful conversation about videos. It combines the capabilities of LLMs with a pretrained visual encoder adapted for spatiotemporal video representation. We also introduce a rigorous 'Quantitative Evaluation Benchmarking' for video-based conversational models.
AI 简介
Video-ChatGPT 是一个能够针对视频内容生成有意义对话的模型,结合了大规模语言模型和预训练的视觉编码器以适应时空视频表示。该项目的核心功能包括基于视频的对话生成、多模态理解和零样本问答能力,并引入了一套严格的定量评估基准来衡量视频对话模型的性能。它适用于需要对视频内容进行深入理解并与其互动的应用场景,例如教育、娱乐、智能客服等领域。
Python
Creative Commons Attribution 4.0 International1.5k
Stars
129
Forks
12
Watchers
25
Issues
Star 增长
今日0
近 7 天+2
近 30 天+5
综合评分45.84
默认分支main