
av-curator
henliveira
Audio-visual data curation pipeline — scene cuts, silence trim, dedup, CLIP/Whisper filtering for messy web video.
AI 简介
AV-Curator 是一个音频-视觉数据整理管道,用于处理网络视频中的场景剪辑、静音修剪、去重和内容过滤。其核心功能包括通过一系列可替换的过滤器对输入的视频清单进行处理,并输出干净的视频清单及可选的重新编码片段。技术上,该工具采用Python编写,支持模块化设计,允许用户根据需求灵活调整过滤流程,如仅使用场景切割与静音修剪或更换为基于CLIP的去重等。此外,每个过滤步骤的结果都会被记录下来,便于审核。适用于需要从原始网络视频中提取高质量训练或评估数据的场景,特别是对于那些希望减少噪声干扰的研究者而言,是一个非常实用的工具。
Python
Other230
Stars
1.8k
Forks
6
Watchers
0
Issues
Star 增长
今日0
近 7 天0
近 30 天+191
综合评分59.8
默认分支main