[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-80102":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":8,"htmlUrl":8,"language":9,"languages":8,"totalLinesOfCode":8,"stars":10,"forks":11,"watchers":12,"openIssues":11,"contributorsCount":13,"subscribersCount":13,"size":13,"stars1d":14,"stars7d":15,"stars30d":16,"stars90d":13,"forks30d":13,"starsTrendScore":17,"compositeScore":18,"rankGlobal":8,"rankLanguage":8,"license":8,"archived":19,"fork":19,"defaultBranch":20,"hasWiki":21,"hasPages":19,"topics":22,"createdAt":8,"pushedAt":8,"updatedAt":23,"readmeContent":24,"aiSummary":25,"trendingCount":13,"starSnapshotCount":13,"syncStatus":26,"lastSyncTime":27,"discoverSource":28},80102,"mimo-image-recognition-mcp","Mriestac\u002Fmimo-image-recognition-mcp","Mriestac",null,"Python",111,1,57,0,9,28,50,27,0.9,false,"main",true,[],"2026-06-12 02:03:58","# MIMO Image Recognition MCP\n\n一个调用小米 MIMO 多模态模型进行图片理解的 MCP Server。\n\n## 重要说明\n\n本 MCP 的作用是在不中断 MIMO 2.5 Pro 主模型对话上下文的前提下，通过 MCP 工具调用 MIMO 2.5 模型单独完成图片识别任务。\n\n它不会让 MIMO 2.5 Pro 模型本身具备多模态图片理解能力；图片理解由本 MCP 背后的 MIMO 2.5 模型完成，再把识别结果返回给主对话模型继续推理。\n\n该 MCP 支持：\n\n- 本地图片路径识别\n- 网络图片 URL 识别\n- Agent 自定义提示词\n- API Key、请求地址、模型名称通过 MCP 启动配置传入\n- 支持通过 PyPI \u002F uvx 运行\n- 支持本地源码运行\n\n## 功能说明\n\n本项目会向 MCP 客户端暴露一个工具：\n\n### `understand_image`\n\n用于调用 MIMO 多模态模型理解图片。\n\n支持的输入方式：\n\n- `image_path`: 单张本地图片路径\n- `image_url`: 单张网络图片 URL\n- `image_paths`: 多张本地图片路径\n- `image_urls`: 多张网络图片 URL\n- `prompt`：由 Agent 自己决定的图片理解任务\n- `system_prompt`：可选系统提示词\n- `temperature`：输出随机性\n- `max_tokens`：最大输出长度\n\n### 建议写入 `CLAUDE.md`\n\n为了让 Claude 在图片识别、OCR、截图分析等任务中稳定调用本 MCP，建议在项目的 `CLAUDE.md` 中加入类似说明：\n\n```markdown\n进行图片识别任务时，只使用 mimo_image_recognition_mcp。\n```\n\n---\n\n## 安装方式一：通过 PyPI \u002F uvx 使用\n\n如果你只是想使用这个 MCP，推荐使用这种方式。\n\nMCP 配置示例：\n\n```json\n{\n  \"mcpServers\": {\n    \"mimo-image-recognition\": {\n      \"command\": \"uvx\",\n      \"args\": [\n        \"--refresh\",\n        \"mimo-image-recognition-mcp\"\n      ],\n      \"env\": {\n        \"MIMO_API_KEY\": \"用户自己的 API Key\",\n        \"MIMO_API_BASE\": \"https:\u002F\u002Ftoken-plan-cn.xiaomimimo.com\u002Fv1\",\n        \"MIMO_MODEL\": \"mimo-v2.5\"\n      }\n    }\n  }\n}\n```\n\n配置项说明：\n\n| 配置项 | 说明 |\n|---|---|\n| `MIMO_API_KEY` | 你的 MIMO API Key |\n| `MIMO_API_BASE` | MIMO API 请求地址，通常为 `https:\u002F\u002Fapi.xiaomimimo.com\u002Fv1`或`https:\u002F\u002Ftoken-plan-cn.xiaomimimo.com\u002Fv1` |\n| `MIMO_MODEL` | 要调用的 MIMO 模型名称，例如 `mimo-v2.5` |\n\n### 网络代理提醒\n\n使用本 MCP 调用 MIMO 接口时，建议不要开启代理。代理可能导致请求超时、连接失败，或影响图片 URL 的访问稳定性。\n\n\n---\n\n## 安装方式二：本地源码运行\n\n如果你想修改源码或参与开发，可以使用本地源码方式。\n\n### 1. 克隆项目\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FMriestac\u002Fmimo-image-recognition-mcp.git\ncd mimo-image-recognition-mcp\n```\n\n\n### 2. 安装依赖\n\n```bash\nuv sync\n```\n\n### 3. MCP 配置示例\n\n```json\n{\n  \"mcpServers\": {\n    \"mimo-image-recognition\": {\n      \"command\": \"uv\",\n      \"args\": [\n        \"--directory\",\n        \"\u003C你的项目路径>\",\n        \"run\",\n        \"mimo-image-recognition-mcp\"\n      ],\n      \"env\": {\n        \"MIMO_API_KEY\": \"你的 MIMO API Key\",\n        \"MIMO_API_BASE\": \"https:\u002F\u002Ftoken-plan-cn.xiaomimimo.com\u002Fv1\",\n        \"MIMO_MODEL\": \"mimo-v2.5\"\n      }\n    }\n  }\n}\n```\n\n请把 `\u003C你的项目路径>` 改成你自己本地项目的真实路径。\n\n---\n\n\n\n## 本地调试\n\n可以使用 MCP Inspector 调试：\n\n```bash\nuv run mcp dev src\u002Fmimo_image_recognition_mcp\u002Fserver.py\n```\n\n如果能看到：\n\n```text\nunderstand_image\n```\n\n说明 MCP Server 启动成功。\n\n如果你想在 MCP Inspector 中实际调用 MIMO 接口，可以在当前终端临时设置：\n\n### Windows PowerShell\n\n```powershell\n$env:MIMO_API_KEY=\"你的 MIMO API Key\"\n$env:MIMO_API_BASE=\"https:\u002F\u002Fapi.xiaomimimo.com\u002Fv1\"\n$env:MIMO_MODEL=\"mimo-v2.5\"\n\nuv run mcp dev src\u002Fmimo_image_recognition_mcp\u002Fserver.py\n```\n\n---\n\n\n## License\n\nMIT\n","Mriestac\u002Fmimo-image-recognition-mcp 是一个调用小米 MIMO 多模态模型进行图片理解的 MCP Server。该项目的核心功能是在不中断 MIMO 2.5 Pro 主模型对话上下文的前提下，通过 MCP 工具单独完成图片识别任务，并将结果返回给主模型继续推理。支持本地图片路径、网络图片 URL 识别及自定义提示词等功能，且可通过 PyPI\u002Fuvx 或本地源码运行。适用于需要在对话系统中集成图片理解能力的场景，如图片识别、OCR 和截图分析等。",2,"2026-06-11 03:59:14","CREATED_QUERY"]