[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-7512":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":17,"stars7d":18,"stars30d":19,"stars90d":16,"forks30d":16,"starsTrendScore":20,"compositeScore":21,"rankGlobal":10,"rankLanguage":10,"license":22,"archived":23,"fork":23,"defaultBranch":24,"hasWiki":25,"hasPages":23,"topics":26,"createdAt":10,"pushedAt":10,"updatedAt":35,"readmeContent":36,"aiSummary":37,"trendingCount":16,"starSnapshotCount":16,"syncStatus":38,"lastSyncTime":39,"discoverSource":40},7512,"roubao","Turbo1123\u002Froubao","Turbo1123","Android Automation Tool Based on Vision-Language Models","",null,"Kotlin",2235,242,9,37,0,1,10,66,8,29.16,"MIT License",false,"main",true,[27,28,29,30,31,32,33,34],"ai","ai-agents","android","android-automation","kotlin","mobile-agents","mobileagent","phone-automation","2026-06-12 02:01:40","\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fimages\u002Flogo.png\" alt=\"肉包 Roubao - AI Android Automation\" width=\"120\" height=\"120\">\n\u003C\u002Fp>\n\n\u003Ch1 align=\"center\">肉包 Roubao\u003C\u002Fh1>\n\n\u003Cp align=\"center\">\n  \u003Cstrong>首款无需电脑的开源 AI 手机自动化助手 | AI Phone Automation Assistant\u003C\u002Fstrong>\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  基于视觉语言模型 (VLM) · 原生 Android Kotlin · 多 Agent 协作架构\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Ca href=\"README_EN.md\">English\u003C\u002Fa> | 简体中文\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPlatform-Android-green.svg\" alt=\"Platform\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FMin%20SDK-26-blue.svg\" alt=\"Min SDK\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-MIT-yellow.svg\" alt=\"License\">\n  \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLanguage-Kotlin-purple.svg\" alt=\"Language\">\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fdemo\u002Fdemo.gif\" width=\"280\" alt=\"演示\">\n\u003C\u002Fp>\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\"docs\u002Fscreenshots\u002F1.jpg\" width=\"180\" alt=\"首页\">\n  \u003Cimg src=\"docs\u002Fscreenshots\u002F3.jpg\" width=\"180\" alt=\"能力\">\n  \u003Cimg src=\"docs\u002Fscreenshots\u002F2.jpg\" width=\"180\" alt=\"执行记录\">\n  \u003Cimg src=\"docs\u002Fscreenshots\u002F4.jpg\" width=\"180\" alt=\"设置\">\n\u003C\u002Fp>\n\n---\n\n## 项目背景\n\n2025 年 12 月，字节跳动联合中兴发布了「豆包手机助手」，一款能够自动操作手机完成复杂任务的 AI 助手。它能帮你比价下单、批量投简历、刷视频，甚至代打游戏。\n\n首批 3 万台工程机定价 3499 元，上线当天即告售罄，二手市场一度炒到 5000+。\n\n**买不到？那就自己做一个。**\n\n于是有了肉包——一个完全开源的 AI 手机自动化助手。\n\n为什么叫「肉包」？因为作者不爱吃素。🥟\n\n---\n\n## 与同类项目的对比\n\n| 特性 | 肉包 | 豆包手机 | 其他开源方案 |\n|------|------|----------|--------------|\n| 需要电脑 | ❌ 不需要 | ❌ 不需要 | ✅ 大多需要 |\n| 需要购买硬件 | ❌ 不需要 | ✅ 需要 3499+ | ❌ 不需要 |\n| 原生 Android 实现 | ✅ Kotlin | ✅ 原生 | ❌ Python |\n| 开源 | ✅ MIT | ❌ 闭源 | ✅ 开源 |\n| Skills\u002FTools 架构 | ✅ 完整 | ❓ 未知 | ❌ 无 |\n| UI 设计 | ⭐⭐⭐½ | ⭐⭐⭐⭐ | ⭐⭐ |\n| 自定义模型 | ✅ 支持 | ❌ 仅豆包 | ✅ 部分支持 |\n\n### 我们解决了什么问题？\n\n**传统的手机自动化方案痛点：**\n\n- 必须连接电脑运行 ADB 命令\n- 需要部署 Python 环境和各种依赖\n- 只能在电脑端操作，手机必须通过数据线连接\n- 技术门槛高，普通用户难以使用\n\n**肉包的解决方案：**\n\n一个 App，装上就能用。无需电脑、无需数据线、无需任何技术背景。\n\n打开 App → 配置 API Key → 说出你想做的事 → 完成。\n\n---\n\n## 为什么选择肉包？\n\n### 原生 Android 实现，不是 Python 脚本的封装\n\n市面上几乎所有手机自动化开源项目（包括阿里的 MobileAgent）都是 **Python 实现**，需要：\n- 在电脑上运行 Python 脚本\n- 手机通过 USB\u002FWiFi ADB 连接电脑\n- 截图通过 ADB 传输到电脑，处理后再把操作指令传回手机\n\n**肉包完全不同。**\n\n我们用 **Kotlin 重写了整个 MobileAgent 框架**，原生运行在 Android 设备上：\n- 截图、分析、执行全部在手机本地完成\n- 无需电脑中转，延迟更低\n- 利用 Shizuku 获得系统级权限，而非繁琐的 ADB 命令\n\n### 为什么需要 Shizuku？\n\nAndroid 系统出于安全考虑，普通 App 无法：\n- 模拟用户点击、滑动屏幕\n- 读取其他 App 的界面内容\n- 执行 `input tap`、`screencap` 等系统命令\n\n传统方案需要连接电脑执行 ADB 命令。而 **Shizuku** 是一个优雅的解决方案：\n\n1. 通过无线调试或电脑 ADB **启动一次** Shizuku 服务\n2. 之后普通 App 就可以获得 ADB 级别的权限\n3. **无需 Root**，无需每次都连接电脑\n\n这让肉包可以直接在手机上执行截图、点击、输入等操作，真正实现「一个 App 搞定一切」。\n\n### 类 Claude Code 的 Tools\u002FSkills 双层架构\n\n受 [Claude Code](https:\u002F\u002Fclaude.ai\u002Fclaude-code) 架构启发，肉包实现了 **Tools + Skills 双层 Agent 框架**：\n\n```\n用户: \"帮我点份外卖\"\n         │\n         ▼\n   ┌─────────────┐\n   │ SkillManager │  ← 意图识别\n   └─────────────┘\n         │\n    ┌────┴────┐\n    │         │\n    ▼         ▼\n🚀 快速路径    🤖 标准路径\n(Delegation)  (GUI 自动化)\n    │              │\n    ▼              ▼\n直接 DeepLink   Agent 循环\n打开小美 AI     操作美团 App\n```\n\n**Tools 层（原子能力）**\n\n底层工具集，每个 Tool 完成一个独立操作：\n\n| Tool | 功能 |\n|------|------|\n| `search_apps` | 智能搜索已安装应用（支持拼音、语义） |\n| `open_app` | 打开应用 |\n| `deep_link` | 通过 DeepLink 跳转到 App 特定页面 |\n| `clipboard` | 读写剪贴板 |\n| `shell` | 执行 Shell 命令 |\n| `http` | HTTP 请求（调用外部 API） |\n\n**Skills 层（用户意图）**\n\n面向用户的任务层，将自然语言映射到具体操作：\n\n| Skill | 类型 | 描述 |\n|-------|------|------|\n| 点外卖(小美) | Delegation | 直接打开小美 AI 让它帮你点 |\n| 点外卖(美团) | GUI 自动化 | 在美团 App 上一步步操作 |\n| 导航(高德) | Delegation | DeepLink 直达高德搜索 |\n| 生成图片(即梦) | Delegation | 打开即梦 AI 生成图片 |\n| 发微信 | GUI 自动化 | 自动操作微信发消息 |\n\n**两种执行模式：**\n\n1. **Delegation（委托）**：高置信度匹配时，直接通过 DeepLink 打开有 AI 能力的 App（如小美、豆包、即梦），让它们完成任务。**快速、一步到位。**\n\n2. **GUI 自动化**：没有 AI 能力的 App（如美团、微信），通过传统的截图-分析-操作循环完成。Skill 会提供操作步骤指导，提高成功率。\n\n---\n\n## 核心特性\n\n### 🤖 智能 AI Agent\n\n- 基于先进的视觉语言模型（VLM），能够\"看懂\"屏幕内容\n- 自然语言指令，说人话就能操作手机\n- 智能决策，根据屏幕状态自动规划下一步操作\n\n### 🎨 精心设计的 UI\n\n**这可能是所有手机自动化开源项目中 UI 做得最好看的。**\n\n- 现代化 Material 3 设计语言\n- 流畅的动画效果\n- 深色\u002F浅色主题自适应\n- 精心设计的首次使用引导\n- 完整的中英文双语支持\n\n### 🔧 高度可定制\n\n- 支持多种 VLM：阿里云通义千问、OpenAI GPT-4V、Claude 等\n- 预设 API 服务商：阿里云、OpenAI、OpenRouter 一键切换\n- 从 API 动态获取可用模型列表，支持模糊搜索\n- 可配置自定义 API 端点，支持本地模型（Ollama、vLLM 等）\n\n### 🔐 安全保护\n\n- API Key 使用 AES-256-GCM 加密存储\n- 检测到支付、密码等敏感页面自动停止\n- 任务执行全程可视，悬浮窗显示进度\n- 随时可以手动停止任务\n- 可选的云端崩溃上报（可在设置中关闭）\n\n### 🔓 Root 模式支持\n\n当 Shizuku 以 Root 权限运行时，肉包可以启用 Root 模式：\n\n- **Root 模式**：解锁更多系统级操作能力\n- **su 命令**：允许执行 `su -c` 命令（需谨慎使用）\n- **自动检测**：自动检测 Shizuku 权限等级（ADB\u002FRoot），非 Root 环境下该选项为灰色不可用\n\n---\n\n## 快速开始\n\n### 前置要求\n\n1. **Android 8.0 (API 26)** 或更高版本\n2. **WiFi 网络** - Shizuku 无线调试依赖 WiFi 连接，确保手机已连接 WiFi\n3. **Shizuku** - 用于获取系统级控制权限\n4. **VLM API Key** - 需要视觉语言模型的 API 密钥（如阿里云通义千问）\n\n### 安装步骤\n\n#### 1. 安装并启动 Shizuku\n\nShizuku 是一个开源工具，可以让普通应用获得 ADB 权限，无需 Root。\n\n- [Google Play](https:\u002F\u002Fplay.google.com\u002Fstore\u002Fapps\u002Fdetails?id=moe.shizuku.privileged.api)\n- [GitHub Releases](https:\u002F\u002Fgithub.com\u002FRikkaApps\u002FShizuku\u002Freleases)\n\n**启动方式（二选一）：**\n\n**无线调试（推荐，需 Android 11+）**\n1. 进入 `设置 > 开发者选项 > 无线调试`\n2. 开启无线调试\n3. 在 Shizuku App 中选择\"无线调试\"方式启动\n\n**电脑 ADB**\n1. 手机连接电脑，开启 USB 调试\n2. 执行：`adb shell sh \u002Fstorage\u002Femulated\u002F0\u002FAndroid\u002Fdata\u002Fmoe.shizuku.privileged.api\u002Fstart.sh`\n\n#### 2. 安装肉包\n\n从 [Releases](..\u002F..\u002Freleases) 页面下载最新 APK 安装。\n\n#### 3. 授权与配置\n\n1. 打开肉包 App\n2. 在 Shizuku 中授权肉包\n3. **⚠️ 重要：进入设置页面，配置你的 API Key**\n\n### 获取 API Key\n\n**阿里云通义千问（推荐国内用户）**\n1. 访问 [阿里云百炼平台](https:\u002F\u002Fbailian.console.aliyun.com\u002F)\n2. 开通 DashScope 服务\n3. 在 API-KEY 管理中创建密钥\n\n**OpenAI（需要代理）**\n1. 访问 [OpenAI Platform](https:\u002F\u002Fplatform.openai.com\u002F)\n2. 创建 API Key\n\n---\n\n## 使用示例\n\n```\n帮我点个附近好吃的汉堡\n打开网易云音乐播放每日推荐\n帮我把最后一张照片发送到微博\n帮我在美团点一份猪脚饭\n打开B站看热门视频\n```\n\n---\n\n## 技术架构\n\n```\n┌──────────────────────────────────────────────────────────────┐\n│                         肉包 App                              │\n├──────────────────────────────────────────────────────────────┤\n│                                                              │\n│   ┌─────────────────────────────────────────────────────┐   │\n│   │                    UI 层 (Compose)                   │   │\n│   │          HomeScreen \u002F Settings \u002F History            │   │\n│   └─────────────────────────────────────────────────────┘   │\n│                            │                                 │\n│   ┌────────────────────────▼────────────────────────────┐   │\n│   │                   Skills 层                          │   │\n│   │    SkillManager → 意图识别 → 快速路径\u002F标准路径        │   │\n│   │    ┌─────────────────────────────────────────────┐  │   │\n│   │    │ 点外卖 │ 导航 │ 打车 │ 发微信 │ AI画图 │ ... │  │   │\n│   │    └─────────────────────────────────────────────┘  │   │\n│   └─────────────────────────────────────────────────────┘   │\n│                            │                                 │\n│   ┌────────────────────────▼────────────────────────────┐   │\n│   │                   Tools 层                           │   │\n│   │    ToolManager → 原子能力封装                        │   │\n│   │    ┌─────────────────────────────────────────────┐  │   │\n│   │    │ search_apps │ open_app │ deep_link │ clipboard │  │\n│   │    │ shell │ http │ screenshot │ tap │ swipe │ type │  │\n│   │    └─────────────────────────────────────────────┘  │   │\n│   └─────────────────────────────────────────────────────┘   │\n│                            │                                 │\n│   ┌────────────────────────▼────────────────────────────┐   │\n│   │                  Agent 层                            │   │\n│   │    MobileAgent (移植自 MobileAgent-v3)               │   │\n│   │    ┌───────────┬───────────┬───────────┬──────────┐ │   │\n│   │    │  Manager  │ Executor  │ Reflector │ Notetaker│ │   │\n│   │    │  (规划)   │  (执行)   │  (反思)   │  (记录)  │ │   │\n│   │    └───────────┴───────────┴───────────┴──────────┘ │   │\n│   └─────────────────────────────────────────────────────┘   │\n│                            │                                 │\n│   ┌────────────────────────▼────────────────────────────┐   │\n│   │                  VLM Client                          │   │\n│   │           Qwen-VL \u002F GPT-4V \u002F Claude                  │   │\n│   └─────────────────────────────────────────────────────┘   │\n│                            │                                 │\n├────────────────────────────┼────────────────────────────────┤\n│                            ▼                                 │\n│   ┌─────────────────────────────────────────────────────┐   │\n│   │                    Shizuku                           │   │\n│   │              System-level Control                    │   │\n│   │     screencap │ input tap │ input swipe │ am start  │   │\n│   └─────────────────────────────────────────────────────┘   │\n└──────────────────────────────────────────────────────────────┘\n```\n\n### 工作流程\n\n```\n用户输入指令\n      │\n      ▼\n┌─────────────────┐\n│  Skills 匹配     │ ← 检查是否有对应的 Skill\n└─────────────────┘\n      │\n      ├── 高置信度 Delegation Skill ──▶ 直接 DeepLink 跳转 ──▶ 完成\n      │\n      ▼\n┌─────────────────┐\n│  标准 Agent 循环 │\n└─────────────────┘\n      │\n      ▼\n   ┌──────────────────────────────────────────────┐\n   │  1. 截图 - Shizuku screencap                 │\n   │  2. Manager 规划 - VLM 分析当前状态          │\n   │  3. Executor 决策 - 确定下一步操作           │\n   │  4. 执行动作 - tap\u002Fswipe\u002Ftype\u002Fopen_app       │\n   │  5. Reflector 反思 - 评估操作效果            │\n   │  6. 循环直到完成或安全限制                   │\n   └──────────────────────────────────────────────┘\n```\n\n### 项目结构\n\n```\napp\u002Fsrc\u002Fmain\u002Fjava\u002Fcom\u002Froubao\u002Fautopilot\u002F\n├── agent\u002F                    # AI Agent 核心 (移植自 MobileAgent-v3)\n│   ├── MobileAgent.kt        # Agent 主循环\n│   ├── Manager.kt            # 规划 Agent\n│   ├── Executor.kt           # 执行 Agent\n│   ├── ActionReflector.kt    # 反思 Agent\n│   ├── Notetaker.kt          # 笔记 Agent\n│   └── InfoPool.kt           # 状态池\n│\n├── tools\u002F                    # Tools 层 - 原子能力\n│   ├── Tool.kt               # Tool 接口定义\n│   ├── ToolManager.kt        # 工具管理器\n│   ├── SearchAppsTool.kt     # 应用搜索\n│   ├── OpenAppTool.kt        # 打开应用\n│   ├── DeepLinkTool.kt       # DeepLink 跳转\n│   ├── ClipboardTool.kt      # 剪贴板操作\n│   ├── ShellTool.kt          # Shell 命令\n│   └── HttpTool.kt           # HTTP 请求\n│\n├── skills\u002F                   # Skills 层 - 用户意图\n│   ├── Skill.kt              # Skill 接口定义\n│   ├── SkillRegistry.kt      # Skill 注册表\n│   └── SkillManager.kt       # Skill 管理器\n│\n├── controller\u002F               # 设备控制\n│   ├── DeviceController.kt   # Shizuku 控制器\n│   └── AppScanner.kt         # 应用扫描 (拼音\u002F语义搜索)\n│\n├── vlm\u002F                      # VLM 客户端\n│   └── VLMClient.kt          # API 调用封装\n│\n├── ui\u002F                       # 用户界面\n│   ├── screens\u002F              # 各个页面\n│   ├── theme\u002F                # 主题定义\n│   └── OverlayService.kt     # 悬浮窗服务\n│\n├── data\u002F                     # 数据层\n│   └── SettingsManager.kt    # 设置管理\n│\n└── App.kt                    # Application 入口\n\napp\u002Fsrc\u002Fmain\u002Fassets\u002F\n└── skills.json               # Skills 配置文件\n```\n\n---\n\n## 路线图\n\n### 已完成 (v1.x)\n\n- [x] **原生 Android 实现** - Kotlin 重写 MobileAgent，摆脱 Python 依赖\n- [x] **Tools 层** - 原子能力封装（search_apps、deep_link、clipboard 等）\n- [x] **Skills 层** - 用户意图映射，支持 Delegation 和 GUI 自动化两种模式\n- [x] **智能应用搜索** - 拼音、语义、分类多维度匹配\n- [x] **快速路径** - 高置信度 Skill 直接 DeepLink 跳转\n\n### 🚀 v2.0 开发中\n\n> 正在开发的重大更新，目前在 `roubao2.0+AccessibilityService` 分支\n\n- [ ] **无障碍服务混合模式** - 集成 AccessibilityService，实现更精准的 UI 操作\n  - 优先使用元素索引点击（不受屏幕变化影响）\n  - 智能回退：索引模式失败时自动切换到坐标模式\n  - 无需 Root，进一步降低使用门槛\n\n- [ ] **UI 树感知** - Agent 能够获取完整的 UI 结构\n  - 识别可点击元素、输入框、滚动区域\n  - 为 LLM 提供结构化 UI 上下文\n  - 减少纯视觉误判\n\n- [ ] **宏脚本系统** - 录制、存储、回放操作序列\n  - 将执行过程录制为可重复播放的脚本\n  - 支持循环播放、延时控制\n  - 脚本管理界面（新增\"脚本\"导航页）\n\n- [ ] **设置增强**\n  - 无障碍服务开关与引导\n  - 混合模式状态展示\n\n### 近期计划\n\n- [ ] **MCP (Model Context Protocol)** - 接入更多能力扩展，如日历、邮件、文件管理等\n- [ ] **执行录屏** - 保存任务执行过程视频，方便回顾和调试\n- [ ] **更多 Skills** - 扩充内置 Skills，支持用户自定义\n\n### 中期计划\n\n- [ ] **更多设备支持** - 适配更多 Android 设备和定制系统（MIUI、ColorOS、HarmonyOS 等）\n- [ ] **本地模型** - 支持在设备端运行小型 VLM，实现离线使用\n- [ ] **任务模板** - 保存和分享常用任务\n\n### 长期愿景\n\n- [ ] **多应用协作** - 跨 App 联动完成复杂工作流\n- [ ] **智能学习** - 从用户操作习惯中学习，优化执行策略\n- [ ] **语音控制** - 语音唤醒和语音指令\n\n---\n\n## 开发\n\n### 环境要求\n\n- Android Studio Hedgehog 或更高版本\n- JDK 17\n- Android SDK 34\n\n### 构建\n\n```bash\n# 克隆仓库\ngit clone https:\u002F\u002Fgithub.com\u002Fyourusername\u002Froubao.git\ncd roubao\n\n# 构建 Debug 版本\n.\u002Fgradlew assembleDebug\n\n# 安装到设备\n.\u002Fgradlew installDebug\n```\n\n---\n\n## 问题反馈\n\n遇到崩溃或 Bug？请通过以下方式反馈：\n\n### 导出日志\n\n1. 打开肉包 App → 设置\n2. 找到「反馈与调试」分组\n3. 点击「导出日志」\n4. 选择分享方式（微信、邮件等）发送给开发者\n\n### 日志包含的信息\n\n- 设备型号和 Android 版本\n- 应用版本号\n- 崩溃堆栈信息（如有）\n- 操作日志\n\n> 💡 日志文件不包含您的 API Key 或个人隐私信息\n\n### 提交 Issue\n\n请在 [GitHub Issues](https:\u002F\u002Fgithub.com\u002FTurbo1123\u002Froubao\u002Fissues) 提交问题，附上：\n- 问题描述\n- 复现步骤\n- 导出的日志文件\n\n---\n\n## 贡献\n\n欢迎提交 Issue 和 Pull Request！\n\n1. Fork 本仓库\n2. 创建特性分支 (`git checkout -b feature\u002Famazing-feature`)\n3. 提交更改 (`git commit -m 'Add some amazing feature'`)\n4. 推送到分支 (`git push origin feature\u002Famazing-feature`)\n5. 开启 Pull Request\n\n---\n\n## 许可证\n\n本项目基于 MIT 许可证开源。详见 [LICENSE](LICENSE) 文件。\n\n---\n\n## 致谢\n\n- [MobileAgent](https:\u002F\u002Fgithub.com\u002FX-PLUG\u002FMobileAgent) - 阿里达摩院 X-PLUG 团队开源的移动端 Agent 框架，为本项目提供了重要的技术参考\n- [Shizuku](https:\u002F\u002Fgithub.com\u002FRikkaApps\u002FShizuku) - 优秀的 Android 权限管理框架\n\n---\n\n\u003Cp align=\"center\">\n  Made with ❤️ by Roubao Team\n\u003C\u002Fp>\n","肉包 Roubao 是一个基于视觉语言模型的 Android 自动化工具，旨在通过 AI 技术实现手机上的自动化操作。其核心功能包括多 Agent 协作架构、原生 Kotlin 开发以及无需电脑即可运行的特点。利用 Shizuku 服务获取系统级权限，肉包能够在手机本地完成截图、分析和执行等任务，从而降低了技术门槛，使得普通用户也能轻松使用。适用于需要自动比价下单、批量投简历、刷视频甚至代打游戏等各种日常场景。",2,"2026-06-11 03:12:50","top_language"]