[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-72499":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":14,"stars7d":17,"stars30d":18,"stars90d":16,"forks30d":16,"starsTrendScore":19,"compositeScore":20,"rankGlobal":10,"rankLanguage":10,"license":21,"archived":22,"fork":22,"defaultBranch":23,"hasWiki":24,"hasPages":22,"topics":25,"createdAt":10,"pushedAt":10,"updatedAt":26,"readmeContent":27,"aiSummary":28,"trendingCount":16,"starSnapshotCount":16,"syncStatus":29,"lastSyncTime":30,"discoverSource":31},72499,"VV","Cicada000\u002FVV","Cicada000","你还在为自己存放的VV表情包不够多，使用时觉得不够贴切而感到烦恼吗？快来试试这个项目吧！","https:\u002F\u002Fvv.cicada000.work",null,"Python",2357,70,4,3,0,7,17,12,70.75,"GNU General Public License v3.0",false,"main",true,[],"2026-06-12 04:01:06","# VV\n\n张维为语录查询项目，纯查询无需下载本项目，直接在[网页端](https:\u002F\u002Fvv.cicada000.work)即可完成查询。\n\n> [!CAUTION]\n> 本项目仅供娱乐，请合理使用。\n\n> [!CAUTION]\n> 本项目最近为流量高峰期，各个网址（如调用API）可能有变动，请仔细阅读README。\n\n## 致谢\n\n&emsp;&emsp;感谢[wen999di](https:\u002F\u002Fgithub.com\u002Fwen999di)及其提交的[PR](https:\u002F\u002Fgithub.com\u002FCicada000\u002FVV\u002Fissues?q=is%3Apr+author%3Awen999di)，大幅提高了人脸检测准确率和字幕识别准确率，同时增加了向量检索的功能。感谢[undef-i](https:\u002F\u002Fgithub.com\u002Fundef-i)及其提交的[PR](https:\u002F\u002Fgithub.com\u002FCicada000\u002FVV\u002Fissues?q=is%3Apr+author%3Aundef-i)，大幅提高了字幕检索速度，构建了更好看的前端页面，并且添加了GPU支持，大幅减少了新版本的人脸识别和字幕识别所需的时间。\n\n## 项目简介\n\n&emsp;&emsp;你还在为自己存放的VV表情包不够多，使用时觉得不够贴切而感到烦恼吗？快来试试这个项目吧！\n\n\u003Cp align=\"center\" style=\"margin-bottom: 0px !important;\">\n\u003Cimg width=\"480\" alt=\"VV_GIF\" src=\"https:\u002F\u002Fraw.githubusercontent.com\u002FCicada000\u002FVV\u002Frefs\u002Fheads\u002Fmain\u002FVV.GIF\">\u003Cbr\u002F>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\" style=\"margin-bottom: 0px !important;\">\n\u003Cimg width=\"480\" alt=\"VV_meme_template\" src=\"https:\u002F\u002Fraw.githubusercontent.com\u002FCicada000\u002FVV\u002Frefs\u002Fheads\u002Fmain\u002FVV_meme_template.png\">\u003Cbr\u002F>\n\u003C\u002Fp>\n\n&emsp;&emsp;本项目主要用于识别vv出现的视频片段（主要针对《这就是中国》节目，后续可能会增加其他视频源）及对应的字幕，并输出为json文件。\n\n## Web网页端使用说明\n\n&emsp;&emsp;访问[vv.cicada000.work](https:\u002F\u002Fvv.cicada000.work\u002F)即可直接使用网页端的台词搜索功能，搜索具有一定的模糊匹配能力。在搜索框内搜索关键词即可匹配含有该关键词的台词。展开高级选项可调整文本匹配度（0-100，默认50）、人脸相似度（0-1，默认0.5）以及是否添加口吧水印。\n\n\u003Ccenter>\u003Cimg src=\"web_index.png\" style=\"max-height:3000px\">\u003C\u002Fcenter>\n\n\u003Ccenter>\u003Cimg src=\"search_result.png\" style=\"max-height:3000px\">\u003C\u002Fcenter>\n\n## Python脚本使用说明\n\n### 文件基本说明\n\n`requirements.txt`：项目包依赖，在使用本项目之前请先下载，否则可能导致项目无法正常运行。\n\n`generate_features.py`：用于生成人脸特征数据的脚本，如果没有自己的数据集可以不用，本项目已经附带了人脸数据集，即`face_features.npz`。如果需要用自己的数据集训练在同级目录新建`target`文件夹进行训练即可。\n\n`generate_features_insightface.py`：用于生成人脸特征数据的脚本，如果没有自己的数据集可以不用，本项目已经附带了人脸数据集，即`face_features_insightface.npz`。如果需要用自己的数据集训练在同级目录新建`target`文件夹进行训练即可。\n\n`target`文件夹，将人脸照片放入即可生成数据集文件，为了方便起见，GitHub仓库中的target文件夹可在Release中找到，解压放入项目中即可进行人脸识别的训练，正常运行识别项目可以不需要这个文件夹。\n\n`subtitle`：文件夹，本项目运行的人脸识别+字幕提取的json文件可以在文件夹中找到。\n\n`face_features.npz`：本项目附带的人脸数据集，可直接使用，针对`FaceRec.py`。\n\n`face_features_indightface.npz`：本项目附带的人脸数据集，可直接使用，针对`FaceRec_insightface.py`。\n\n`FaceRec.py`：人脸识别脚本，使用[dlib](https:\u002F\u002Fgithub.com\u002Fdavisking\u002Fdlib)的方案。\n\n`FaceRec_insightface.py`：使用了[insightface](https:\u002F\u002Fgithub.com\u002Fdeepinsight\u002Finsightface)的人脸识别方案，相比于`FaceRec.py`准确率更高。\n\n`CutSubtitle.py`：针对《这就是中国》节目视频的字幕裁剪识别脚本，使用[ddddocr](https:\u002F\u002Fgithub.com\u002Fsml2h3\u002Fddddocr)。\n\n`CutSubtitle_paddleocr.py`：字幕裁剪识别脚本，使用[PaddleOCR](https:\u002F\u002Fgithub.com\u002FPaddlePaddle\u002FPaddleOCR)。\n\n`main.py`：主函数，程序入口。\n\n`api`：文件夹，网页API后端代码，API具体用法见下。\n\n`Web`：文件夹，网页前端代码。\n\n`search`: 文件夹，句意搜索\n\n### 运行本项目的说明\n\n> [!TIP]\n> 如果要使用GPU进行训练，推荐使用Linux环境~~因为我Windows配半天没配好~~。笔者环境为WSL2 Ubuntu24.04 + CUDA12.8 + libcudnn9\n\n正常使用CPU运行直接下载依赖运行即可（应该）。\n\n如需使用GPU运行（这玩意拿纯CPU运行慢的要死），在下载相关pip库时需下载GPU版本。例如`pip install paddlepaddle`需改为`pip install paddlepaddle-gpu`，使用高版本的CUDA时，则需要下载更高版本的库，可在官网找到[下载命令](https:\u002F\u002Fwww.paddlepaddle.org.cn\u002Fen\u002Finstall\u002Fquick?docurl=\u002Fdocumentation\u002Fdocs\u002Fen\u002Fdevelop\u002Finstall\u002Fpip\u002Flinux-pip_en.html)。\n\n## API使用说明\n\n&emsp;&emsp;API具体请求示例如下：\n\n```\nhttps:\u002F\u002Fvvapi.cicada000.work\u002Fsearch?query=测试&min_ratio=50&min_similarity=0.5&max_results=10\n```\n\n参数解释：\n\n`query`：请求查询的关键词。\n\n`min_ratio`：关键词在句子中的最小匹配度。（这一部分算法还待优化）\n\n`min_similarity`：最小的人脸识别匹配度，一般认为0.5以上为VV。\n\n`max_results`：返回的结果最多的个数，如果不添加默认返回全部匹配的结果。\n\n## 句意搜索使用说明\n\u003Ccenter>\u003Cimg src=\"search.GIF\" style=\"max-height:3000px\">\u003C\u002Fcenter>\n\n运行`search\u002Fsearch.py`\n可从[Releases](https:\u002F\u002Fgithub.com\u002Fwen999di\u002FVV\u002Freleases\u002Fdownload\u002Findex\u002Findex.zip)下载构建完成的向量索引数据库，解压到search文件夹下\n\n## To-Do List\n\n- [x] 提高人脸识别精度\n- [x] 改进搜索算法\n- [x] 添加视频源\n- [ ] 网页端错误上报功能（真的需要吗）\n\n## 主要使用的开源项目\n\n[ddddocr](https:\u002F\u002Fgithub.com\u002Fsml2h3\u002Fddddocr)\n\n[PaddleOCR](https:\u002F\u002Fgithub.com\u002FPaddlePaddle\u002FPaddleOCR)\n\n[insightface](https:\u002F\u002Fgithub.com\u002Fdeepinsight\u002Finsightface)\n\n[dlib](https:\u002F\u002Fgithub.com\u002Fdavisking\u002Fdlib)\n\n[BBDown](https:\u002F\u002Fgithub.com\u002Fnilaoda\u002FBBDown)","该项目是一个用于查询张维为语录的表情包生成工具，用户可通过网页端或API接口快速找到相关视频片段及其字幕。其核心功能包括基于人脸检测和字幕识别技术从特定视频源（如《这就是中国》节目）中提取含有指定关键词的片段，并支持高级选项调整匹配精度及是否添加水印。项目采用了dlib与insightface两种人脸识别方案以提高准确率，同时利用ddddocr和PaddleOCR进行字幕识别优化了检索速度。此外，还引入了向量检索机制进一步增强搜索效率。适用于需要根据内容快速制作或查找表情包的场景，尤其适合对张维为言论感兴趣的人群。",2,"2026-06-11 03:42:19","high_star"]