[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-81063":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":8,"htmlUrl":8,"language":9,"languages":8,"totalLinesOfCode":8,"stars":10,"forks":11,"watchers":11,"openIssues":12,"contributorsCount":12,"subscribersCount":12,"size":12,"stars1d":12,"stars7d":12,"stars30d":13,"stars90d":12,"forks30d":12,"starsTrendScore":12,"compositeScore":14,"rankGlobal":8,"rankLanguage":8,"license":8,"archived":15,"fork":15,"defaultBranch":16,"hasWiki":17,"hasPages":15,"topics":18,"createdAt":8,"pushedAt":8,"updatedAt":19,"readmeContent":20,"aiSummary":21,"trendingCount":12,"starSnapshotCount":12,"syncStatus":11,"lastSyncTime":22,"discoverSource":23},81063,"Automated-GitHub-Repository-Categorization-Chrome-Extension","BINGOik\u002FAutomated-GitHub-Repository-Categorization-Chrome-Extension","BINGOik",null,"Python",107,2,0,60,1.43,false,"main",true,[],"2026-06-12 02:04:10","# GitHub README Domain Classifier\n\n一个 Chrome 浏览器扩展，自动对 GitHub 仓库进行开发领域分类，并在项目名称旁显示分类徽标。\n\n## 功能特性\n\n- 在 GitHub 仓库页面标题旁自动显示领域分类徽标\n- 支持 Explore、Trending、Topics、Search 等列表页面批量展示分类\n- 弹窗开关一键启用\u002F禁用\n- 可选配置 ChatGPT API Key 或 Kimi API Key，启用 LLM 辅助判定\n- 基于 SVM + LLM 的混合分类策略：置信度高时直接用 SVM，低时回退 LLM\n\n### 支持的分类类别\n\n桌面应用、AI 与机器学习、微信小程序开发、企业应用、Web 应用、移动应用、代码开发工具或插件、服务端应用、游戏开发、应用插件、其他、未分类\n\n## 项目结构\n\n```\n├── 前端代码\u002F\n│   ├── manifest.json          # Chrome 扩展清单\n│   ├── popup.html             # 弹出窗口界面\n│   ├── popup.js               # 弹出窗口逻辑（开关、设置）\n│   ├── content.js             # 内容脚本（注入 GitHub 页面）\n├── 后端代码\u002F\n│   ├── domain_get.py          # Flask 服务入口（API 路由）\n│   ├── svm_predictor.py       # SVM 模型预测器\n│   ├── readme_words.py        # README 关键词提取\n│   ├── gpt_predictor.py       # GPT 分类器\n│   ├── kimi_predictor.py      # Kimi\u002FMoonshot 分类器\n│   ├── linear_svc_model.pkl   # 训练好的 SVM 模型\n│   ├── scaler.pkl             # 特征标准化器\n│   ├── label_mapping.pkl      # 标签映射\n│   ├── keyword_dict.pkl       # 关键词字典\n│   └── label_encoder.pkl      # 标签编码器\n└── readme.md\n```\n\n## 工作原理\n\n1. 用户浏览 GitHub 仓库页面时，扩展的 content script 检测页面类型\n2. 将仓库的 owner\u002Frepo 发送到本地 Flask 后端 `POST \u002Fdomain`\n3. 后端通过 GitHub API 获取仓库 README 内容\n4. 从 README 中提取高频关键词，送入 SVM 模型预测分类\n5. 若 SVM Top1 与 Top2 概率差 >= 0.15，直接采用 SVM 结果\n6. 若差值不足且配置了 API Key，调用 LLM（Kimi\u002FGPT）进行二次判定\n7. 返回最终分类结果，前端在仓库名旁渲染徽标\n\n## 后端部署\n\n### 环境要求\n\n- Python 3.12+\n- 可访问 GitHub API 的网络环境\n\n### 安装依赖\n\n```bash\npip install flask flask-cors openai joblib numpy scipy scikit-learn\n```\n\n### 配置\n\n1. 在 `domain_get.py` 中设置 `GITHUB_TOKEN`（用于调用 GitHub API 获取 README）\n2. （可选）如需 LLM 判定，在前端弹窗设置中填入 API Key：\n   - Kimi：使用 `kimi_predictor.py`，默认模型 `kimi-k2-turbo-preview`，endpoint `https:\u002F\u002Fapi.moonshot.cn\u002Fv1`\n   - GPT：使用 `gpt_predictor.py`，默认模型 `gpt-4o-mini`\n\n### 启动服务\n\n```bash\ncd 后端代码\npython domain_get.py\n```\n\n启动后控制台输出示例：\n\n```\n* Running on http:\u002F\u002F127.0.0.1:8000\n* Running on http:\u002F\u002F192.168.1.36:8000\n```\n\n默认监听 `0.0.0.0:8000`，前端扩展默认连接 `http:\u002F\u002F127.0.0.1:8000\u002Fdomain`。\n\n## 浏览器扩展安装\n\n1. 打开 Chrome 浏览器，进入 `chrome:\u002F\u002Fextensions\u002F`\n2. 开启右上角 **开发者模式**\n3. 点击 **加载未打包的扩展程序**\n4. 选择 `前端代码\u002F` 目录\n5. 扩展安装完成，工具栏出现 Domain Classifier 图标\n\n## 使用说明\n\n1. 确保后端服务已启动\n2. 点击扩展图标，打开 **插件开关**\n3. （可选）点击齿轮图标进入设置，填入 API Key\n4. 访问任意 GitHub 仓库页面或列表页，即可看到分类徽标\n\n## 注意事项\n\n- 后端默认连接 `http:\u002F\u002F127.0.0.1:8000`，如需修改请编辑 `content.js` 中的 `API_URL`\n- GitHub API 有频率限制，建议配置 GitHub Token 以提高限额\n- LLM 判定需要有效的 API Key，未配置时仅使用 SVM 预测\n- 模型文件（`.pkl`）需与 `domain_get.py` 在同一目录下\n","这是一个Chrome浏览器扩展，用于自动对GitHub仓库进行开发领域分类，并在项目名称旁显示分类徽标。核心功能包括在GitHub仓库页面标题旁自动显示领域分类徽标，支持批量展示Explore、Trending等列表页面的分类，以及通过弹窗开关一键启用或禁用。该扩展采用SVM与LLM（如ChatGPT或Kimi）混合分类策略，当SVM置信度较低时会调用LLM辅助判定。适用于需要快速了解GitHub项目所属领域的开发者和研究者，尤其是在浏览大量项目时能够显著提高效率。","2026-06-11 04:03:21","CREATED_QUERY"]