[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-75604":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":8,"htmlUrl":8,"language":9,"languages":8,"totalLinesOfCode":8,"stars":10,"forks":11,"watchers":12,"openIssues":13,"contributorsCount":14,"subscribersCount":14,"size":14,"stars1d":15,"stars7d":16,"stars30d":17,"stars90d":14,"forks30d":14,"starsTrendScore":18,"compositeScore":19,"rankGlobal":8,"rankLanguage":8,"license":8,"archived":20,"fork":20,"defaultBranch":21,"hasWiki":22,"hasPages":20,"topics":23,"createdAt":8,"pushedAt":8,"updatedAt":24,"readmeContent":25,"aiSummary":26,"trendingCount":14,"starSnapshotCount":14,"syncStatus":13,"lastSyncTime":27,"discoverSource":28},75604,"claude-vision-skill","asuojun\u002Fclaude-vision-skill","asuojun",null,"JavaScript",225,8,1,2,0,36,70,201,108,2.86,false,"master",true,[],"2026-06-12 02:03:35","# Claude Vision Skill\n\n让没有识图能力的模型获得识图能力——把图片发给有 vision 的模型，用文字描述回来。\n\n---\n\n## 如果你是 AI（Claude Code），请读这里\n\n用户把这个链接发给你，是想让你帮他配置识图。先确认信息，再按场景执行。\n\n### 先确认\n\n问用户：\n1. 想用哪个识图服务？\n   - **推荐千问**（`qwen3.5-omni-plus` \u002F `qwen-vl-max`）：阿里云百炼，新用户 100 万 token 免费，约 0.02 元\u002F次\n   - 也可以用 OpenAI（`gpt-4o-mini`）或其他支持 OpenAI 兼容格式的 vision 模型\n2. API Key 是什么？没申请的话引导去对应平台注册\n3. （如果用非千问服务）API Base URL 是什么？\n\n### 场景 A：用户要在普通 Claude Code 项目里用\n\n1. 把这个仓库里的 `vision.js` 下载到项目根目录\n2. 替换 `vision.js` 里的 `sk-xxx` → 用户的 Key，`xxx` → 模型名。如果用的不是千问，同步改 `BASE_URL`\n3. 把 `CLAUDE.md` 的内容合并到项目的 `CLAUDE.md`（没有就新建）\n4. 告诉用户：配置完成，以后直接发图片就行，AI 会自动识图\n\n### 场景 B：用户要在 cyberboss 里用\n\n1. 先执行场景 A 的所有步骤\n2. 接着读这个仓库里的 `cyberboss-setup.md`，按它说的改 persona 和 `src\u002Fcore\u002Fapp.js`\n3. 告诉用户：重启 cyberboss 后生效，微信里直接发图片就能识图\n\n### 场景 C：用户只想了解这是什么\n\n简要解释：\n- `vision.js` 是核心，读取图片 → base64 → 发给 vision 模型 API → 返回文字描述\n- 走 OpenAI 兼容格式，不绑定特定厂商\n- 推荐千问是因为有免费额度；有别的便宜 vision API 也能用\n- 配置好之后，用户直接发图片，AI 自动处理，无需手动打命令\n\n---\n\n## 如果你是人类，请读这里\n\n### 这是什么\n\n一个让 DeepSeek 等无 vision 能力的模型也能\"看图\"的脚本。配置好之后，直接发图片 AI 就会自动识别。\n\n### 推荐识图服务\n\n| 服务 | 模型 | 备注 |\n|------|------|------|\n| **阿里云百炼（推荐）** | `qwen3.5-omni-plus` | 新用户 100 万 token 免费 |\n| 阿里云百炼 | `qwen-vl-max` | 同上 |\n| OpenAI | `gpt-4o-mini` | 需海外支付 |\n| 其他 | 任何 OpenAI 兼容格式 | 改 `BASE_URL` 和模型名即可 |\n\n### 自动配置\n\n**方式一（推荐）**：先把仓库 clone 到本地，然后告诉 Claude Code 本地路径：\n\n```\ngit clone https:\u002F\u002Fgithub.com\u002Fasuojun\u002Fclaude-vision-skill.git\n```\n\n然后在 Claude Code 里说：\n\n> 读一下 claude-vision-skill\u002FREADME.md，帮我配置识图\n\n**方式二**：直接发 GitHub 链接（DeepSeek 等第三方模型可能无法访问 GitHub）：\n\n> 按 https:\u002F\u002Fgithub.com\u002Fasuojun\u002Fclaude-vision-skill 的 README 帮我配置识图\n\nAI 会问你用什么服务、Key 是什么，然后自动配好。\n\n### 手动配置\n\n1. 把 `vision.js` 拷到项目里\n2. 打开 `vision.js`，填 API Key、模型名（如用非千问服务还需改 API 地址）\n3. 把 `CLAUDE.md` 放到项目根目录\n\n### 文件说明\n\n| 文件 | 用途 |\n|------|------|\n| `vision.js` | 核心脚本，OpenAI 兼容格式 |\n| `CLAUDE.md` | 项目说明书，告诉 AI 何时用 vision.js |\n| `cyberboss-setup.md` | cyberboss 自动配置指令 |\n","该项目为不具备图像识别能力的AI模型提供图像识别功能，通过将图片发送给具备视觉处理能力的模型并接收文字描述来实现。核心功能由`vision.js`脚本完成，支持多种视觉API服务，包括阿里云百炼和OpenAI兼容格式，并推荐使用具有免费额度的千问模型。用户只需简单配置即可在普通Claude Code项目或cyberboss环境中启用自动识图功能，适用于希望增强现有对话式AI系统视觉处理能力的场景。","2026-06-11 03:53:01","CREATED_QUERY"]