[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-80782":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":9,"language":10,"languages":9,"totalLinesOfCode":9,"stars":11,"forks":12,"watchers":13,"openIssues":14,"contributorsCount":15,"subscribersCount":15,"size":15,"stars1d":15,"stars7d":16,"stars30d":17,"stars90d":15,"forks30d":15,"starsTrendScore":18,"compositeScore":19,"rankGlobal":9,"rankLanguage":9,"license":20,"archived":21,"fork":21,"defaultBranch":22,"hasWiki":23,"hasPages":21,"topics":24,"createdAt":9,"pushedAt":9,"updatedAt":25,"readmeContent":26,"aiSummary":27,"trendingCount":15,"starSnapshotCount":15,"syncStatus":14,"lastSyncTime":28,"discoverSource":29},80782,"deepseek-vision","ErlichLiu\u002Fdeepseek-vision","ErlichLiu","为 DeepSeek v4 系列补齐视觉理解、联网搜索与 Anthropic \u002F OpenAI 兼容接口的代理服务",null,"Python",58,14,1,2,0,11,19,4,50.93,"MIT License",false,"main",true,[],"2026-06-12 04:01:30","# deepseek-vision\n\n**为 DeepSeek 补齐视觉理解、联网搜索与 Anthropic \u002F OpenAI 兼容接口的代理服务。**\n\n[English](.\u002FREADME.en.md)\n\nDeepSeek 官方 API 是纯文本模型，这会极大限制 Agent 的能力以及用户的对话体验，尤其是在 Claude Code 等场景使用时还需要额外的联网搜索和抓取能力，本项目也一并补齐。\n\n本项目是 [Proma](https:\u002F\u002Fproma.cool) 的旁支开源项目。Proma 是最丝滑的通用开源 Agent，对 DeepSeek v4 系列的适配最为完整，已在云端服务中补齐了包括视觉、联网搜索在内的全部缺失能力，欢迎直接使用。本仓库提供可自部署的代理版本，让你用同一个 DeepSeek API Key 接入任何 AI 工具。\n\n---\n\n## 快速开始\n\n### 配置器（推荐）\n\n启动后访问 `http:\u002F\u002Flocalhost:8000`，在配置器页面填写 API Key，点击「应用并重启」即可。\n\n```bash\n# Docker\ndocker build -t deepseek-vision .\ndocker run -p 8000:8000 deepseek-vision\n```\n\n### 手动配置\n\n```bash\ncp .env.example .env\n# 编辑 .env，至少填写：ADMIN_PASSWORD、MASTER_API_KEY、DEEPSEEK_API_KEY\n```\n\n```bash\n# Docker\ndocker run --env-file .env -p 8000:8000 deepseek-vision\n\n# 本地（uv）\nuv sync && uv run python main.py\n\n# 本地（pip）\npip install . && python main.py\n```\n\n---\n\n## 界面预览\n\n\u003Ctable>\n  \u003Ctr>\n    \u003Ctd align=\"center\">\u003Cb>登录页\u003C\u002Fb>\u003C\u002Ftd>\n    \u003Ctd align=\"center\">\u003Cb>配置器\u003C\u002Fb>\u003C\u002Ftd>\n  \u003C\u002Ftr>\n  \u003Ctr>\n    \u003Ctd>\u003Cimg src=\".\u002Fdocs\u002Fscreenshot-login.png\" alt=\"登录页\" width=\"380\"\u002F>\u003C\u002Ftd>\n    \u003Ctd>\u003Cimg src=\".\u002Fdocs\u002Fscreenshot-dashboard.png\" alt=\"配置器\" width=\"380\"\u002F>\u003C\u002Ftd>\n  \u003C\u002Ftr>\n\u003C\u002Ftable>\n\n---\n\n## 接口列表\n\n| 方法 | 路径 | 说明 |\n|------|------|------|\n| `POST` | `\u002Fv1\u002Fmessages` | Anthropic Messages API |\n| `POST` | `\u002Fv1\u002Fmessages\u002Fcount_tokens` | Token 计数 |\n| `POST` | `\u002Fv1\u002Fchat\u002Fcompletions` | OpenAI Chat Completions API |\n| `GET`  | `\u002Fv1\u002Fmodels` | 查询可用模型 |\n| `GET`  | `\u002Fhealth` | 存活检查 |\n| `GET`  | `\u002F` | 配置器 UI |\n\n所有 API 端点需要通过 `x-api-key` 请求头（Anthropic 风格）或 `Authorization: Bearer \u003Ckey>`（OpenAI 风格）传入 `MASTER_API_KEY`。\n\n---\n\n## 工作原理\n\n```\n客户端（Anthropic SDK \u002F OpenAI SDK \u002F LangChain \u002F Cline）\n    │\n    ├─ POST \u002Fv1\u002Fchat\u002Fcompletions  ──►  OpenAI → Anthropic 格式转换\n    │                                            │\n    └─ POST \u002Fv1\u002Fmessages  ──────────────────────►┤\n                                                 │\n                                       视觉中间件\n                                       图片块 → 调用视觉模型 → 文字描述\n                                                 │\n                                       web_search \u002F web_fetch 中间件\n                                       Anthropic 工具协议 → Tavily\u002FBrave\n                                       → 结果注入上下文\n                                                 │\n                                       DeepSeek 上游\n                                       （Anthropic Messages API）\n                                                 │\n                                       响应 → 返回给客户端\n```\n\n---\n\n## 视觉补齐\n\n默认使用阿里云 Qwen（`qwen3.6-flash`），只需填写 `VISION_API_KEY` 即可启用：\n\n```env\nVISION_API_KEY=sk-your-dashscope-key\n```\n\n每个请求里的 `image` 内容块会被替换为 `[Image N] \u003C描述文字>` 的文本块，多张图片并行处理。\n\n也可以替换为其他 OpenAI 兼容的视觉模型：\n\n```env\nVISION_BASE_URL=https:\u002F\u002Fapi.openai.com\u002Fv1\nVISION_API_KEY=sk-...\nVISION_MODEL=gpt-4o-mini\n```\n\n支持的视觉后端（任何具有 OpenAI 兼容接口的服务）：\n- 阿里云 DashScope（`qwen3.6-flash`、`qwen-vl-max` 等）\n- OpenAI（`gpt-4o`、`gpt-4o-mini`）\n- GLM-4V、InternVL、LLaVA（通过 vLLM 自部署）\n\n---\n\n## 联网搜索与网页抓取\n\n在请求中使用 Anthropic 工具协议添加 `web_search` 或 `web_fetch` 工具。代理会拦截工具调用、执行搜索\u002F抓取，并将结果注回上下文——DeepSeek 本身仍只做文本生成。\n\n### web_search\n\n两轮架构：第一轮让模型规划所有查询（并行执行），第二轮基于搜索结果生成最终答案。结果自动附加 `[N]` 引用标注。\n\n配置 Tavily（推荐）或 Brave：\n\n```env\nTAVILY_API_KEY=tvly-...\n# 或\nWEB_SEARCH_PROVIDER=brave\nBRAVE_API_KEY=BSA-...\n```\n\n### web_fetch\n\n带 SSRF 防护和 DNS pinning 的 URL 抓取。支持 HTML、纯文本和 PDF。结果自动附加 `[Document N]` 引用标注。无需额外配置。\n\n---\n\n## 模型配置\n\n默认暴露 `deepseek-v4-pro` 和 `deepseek-v4-flash`，可通过 `DEEPSEEK_MODELS` 自定义：\n\n```env\n# 直接使用上游 ID\nDEEPSEEK_MODELS=deepseek-v4-pro,deepseek-v4-flash\n\n# 使用别名（client-id:upstream-id）\nDEEPSEEK_MODELS=pro:deepseek-v4-pro,flash:deepseek-v4-flash\n```\n\n通过 `EXTRA_BACKEND_*` 添加第二个 Anthropic 兼容上游：\n\n```env\nEXTRA_BACKEND_NAME=my-provider\nEXTRA_BACKEND_BASE_URL=https:\u002F\u002Fapi.example.com\u002Fanthropic\nEXTRA_BACKEND_API_KEY=sk-...\nEXTRA_BACKEND_MODELS=model-a,model-b\n```\n\n---\n\n## 配置项说明\n\n| 变量 | 默认值 | 说明 |\n|------|--------|------|\n| `ADMIN_PASSWORD` | `123456` | 配置器登录密码，**请修改** |\n| `MASTER_API_KEY` | 必填 | 客户端访问代理所用的 Key，逗号分隔支持多个 |\n| `DEEPSEEK_API_KEY` | 必填 | DeepSeek API Key |\n| `DEEPSEEK_BASE_URL` | `https:\u002F\u002Fapi.deepseek.com\u002Fanthropic` | DeepSeek 上游地址 |\n| `DEEPSEEK_MODELS` | `deepseek-v4-pro,deepseek-v4-flash` | 暴露给客户端的模型列表 |\n| `VISION_BASE_URL` | `https:\u002F\u002Fdashscope.aliyuncs.com\u002Fcompatible-mode\u002Fv1` | 视觉模型接口地址 |\n| `VISION_API_KEY` | — | 视觉模型 API Key（留空则禁用视觉补齐） |\n| `VISION_MODEL` | `qwen3.6-flash` | 视觉模型名称 |\n| `VISION_MAX_IMAGES` | `5` | 单次请求最多处理的图片数量 |\n| `WEB_SEARCH_PROVIDER` | `tavily` | 搜索服务商（`tavily` 或 `brave`） |\n| `TAVILY_API_KEY` | — | Tavily API Key |\n| `BRAVE_API_KEY` | — | Brave Search API Key |\n| `PORT` | `8000` | 服务端口 |\n| `LOG_LEVEL` | `INFO` | 日志级别 |\n\n---\n\n## Roadmap\n\n- [ ] `\u002Fv1\u002Fembeddings` 接口\n- [ ] SearXNG 搜索支持（自部署）\n- [ ] OpenAI 兼容模式下的流式工具调用\n\n---\n\n## License\n\nMIT\n","deepseek-vision 是一个为 DeepSeek v4 系列补齐视觉理解、联网搜索与 Anthropic \u002F OpenAI 兼容接口的代理服务。其核心功能包括将图像转换为文字描述，支持多种视觉模型如阿里云 Qwen 和 OpenAI 的 gpt-4o-mini，并且能够执行联网搜索和网页抓取任务，从而增强纯文本模型的能力。项目使用 Python 开发，提供了 Docker 部署选项以及简单的配置管理界面，方便用户快速上手。它非常适合需要在对话系统中引入多模态处理能力的应用场景，比如开发更智能的聊天机器人或提升现有 AI 工具的功能完整性。","2026-06-11 04:02:18","CREATED_QUERY"]