[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-1821":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":8,"htmlUrl":8,"language":9,"languages":8,"totalLinesOfCode":8,"stars":10,"forks":11,"watchers":12,"openIssues":13,"contributorsCount":14,"subscribersCount":14,"size":14,"stars1d":15,"stars7d":16,"stars30d":17,"stars90d":14,"forks30d":14,"starsTrendScore":18,"compositeScore":19,"rankGlobal":8,"rankLanguage":8,"license":8,"archived":20,"fork":20,"defaultBranch":21,"hasWiki":20,"hasPages":20,"topics":22,"createdAt":8,"pushedAt":8,"updatedAt":23,"readmeContent":24,"aiSummary":25,"trendingCount":14,"starSnapshotCount":14,"syncStatus":26,"lastSyncTime":27,"discoverSource":28},1821,"sightflow-desktop-agent","sightflow-dev\u002Fsightflow-desktop-agent","sightflow-dev",null,"TypeScript",451,149,4,1,0,34,60,275,102,6.53,false,"main",[],"2026-06-12 02:00:33","# SightFlow.dev\n\u003Cimg width=\"1201\" height=\"495\" alt=\"image\" src=\"https:\u002F\u002Fgithub.com\u002Fuser-attachments\u002Fassets\u002F99a7cfec-eb22-4f65-8a76-a6974e46bcf0\" \u002F>\n\nOfficial website： [https:\u002F\u002Fsightflow.dev](https:\u002F\u002Fsightflow.dev\u002F)\n\n\n# 招募共建开发者\n我们相信Agent Computer Use 会是未来10年重要AI革命的基建，如果你也希望参与到这个项目迭代，欢迎联系\\\n\n[加入Discord](https:\u002F\u002Fdiscord.com\u002Finvite\u002F8H6KpbXq3t)\n\n## 🔑 AI 模型与智能体配置\n\n本项目依赖大语言模型\u002F视觉模型（Vision Language Model）驱动 RPA。\n桌面端的配置分为两层：\n\n- **基础配置**：填写火山方舟 API Key，用于视觉定位、内置豆包智能体等基础能力。\n- **智能体**：选择负责聊天分析和内容生成的 Provider，并维护各自配置。\n\n### SK Key 的用途\n1. **智能对话回复**：由于项目涉及类似微信等的自动抓取，模型会分析聊天界面的截图并生成自然的回复内容（带防止自我循环对话机制）。\n2. **VLM 视觉定位引导**：基于屏幕截图和特定 Prompt，让模型自动检测屏幕上的 UI 控件，并返回需要点击的坐标，从而驱动纯视觉的 RPA 流程。\n\n### 如何配置\n1. 请前往 [火山引擎控制台 - 方舟原生接口](https:\u002F\u002Fconsole.volcengine.com\u002Fark) 开通相关服务，并生成\u002F获取你的 API Key。\n2. 启动项目后点击主界面右下角的设置按钮，打开独立设置窗口。\n3. 在**基础配置**中填写 API Key。默认 Base URL 为 `https:\u002F\u002Fark.cn-beijing.volces.com\u002Fapi\u002Fv3`，通常无需修改。\n4. 在**智能体**中选择当前使用的 Provider。内置默认智能体为**豆包 Seed**，模型固定为 `doubao-seed-2-0-lite-260428`。\n\n### 界面预览\n\n| 主界面 | 基础配置 | 智能体配置 |\n| --- | --- | --- |\n| \u003Cimg width=\"240\" alt=\"SightFlow 主界面\" src=\".\u002Fdocs\u002Fimages\u002Fmain.png\" \u002F> | \u003Cimg width=\"360\" alt=\"SightFlow 基础配置\" src=\".\u002Fdocs\u002Fimages\u002Fsettings-base.png\" \u002F> | \u003Cimg width=\"360\" alt=\"SightFlow 智能体配置\" src=\".\u002Fdocs\u002Fimages\u002Fsettings-provider.png\" \u002F> |\n\n## 目标应用与框选模式\n\n主界面提供**目标应用**快捷配置，用来决定桌面端如何测量聊天窗口布局：\n\n- 微信、企业微信默认使用 VLM 自动识别窗口区域。\n- 钉钉、飞书、Slack、Telegram、其他桌面应用默认使用手动框选。\n- 当目标应用需要框选时，点击**开始框选**，依次圈出会话列表、聊天内容区、输入框 3 个区域。\n- 框选结果会按目标应用保存到本地；后续启动会复用已保存区域，也可以随时重新框选。\n\nVLM 和框选模式只影响“如何测量布局”。运行时截图、内容分析、生成回复和发送消息会消费同一套布局结果。\n\n## 智能体 \u002F Provider Hub\n\nSightFlow 桌面端把“截图分析并生成回复”的聊天能力抽象为独立 Provider。Provider 通过 `manifest.json` 声明配置结构，通过 bundle 入口接收聊天截图并返回 `reply_text`、`skip`、`error` 等事件。\n\n当前应用内置一个简单的 Provider Hub：\n\n- 默认从 `https:\u002F\u002Fsightflow.dev\u002Fprovider-hub.json` 拉取候选 Provider 列表。\n- Hub 只维护 Provider 的 `manifestUrl`，UI 展示字段来自各 Provider 的 manifest。\n- 首次加载后会缓存到本地；除非手动点击智能体标题旁的刷新按钮，否则优先使用本地缓存。\n- 本地始终保留内置**豆包 Seed**作为默认 Provider，避免远端列表不可用时没有可选项。\n\n外部 Provider 接入说明见：[聊天 Provider 接入文档](.\u002Fdocs\u002Fprovider.md)。\n\n当前仓库仍保留一个 Doubao \u002F 火山方舟 Provider 示例，供接入文档和本地开发参考：\n\n```text\nresources\u002Fproviders\u002Fvolcengine-ark\u002Fmanifest.json\nresources\u002Fproviders\u002Fvolcengine-ark\u002Fprovider.bundle.js\n```\n\n## 🚀 快速开始 (Project Setup)\n\n### 1. 安装依赖\n\n```bash\nnpm install\n```\n\n### 2. 本地开发运行\n\n```bash\nnpm run dev\n```\n> **提示**：启动后，应用将打开主界面。请先选择目标应用并完成必要的框选，再进入设置窗口填写 API Key、确认当前启用的 Provider。\n\n## 📦 打包构建 (Build)\n\n```bash\n# 构建 Windows 版本\nnpm run build:win\n\n# 构建 macOS 版本\nnpm run build:mac\n\n```\n\n## 开发环境推荐配置\n\n- [VSCode](https:\u002F\u002Fcode.visualstudio.com\u002F) + [ESLint](https:\u002F\u002Fmarketplace.visualstudio.com\u002Fitems?itemName=dbaeumer.vscode-eslint) + [Prettier](https:\u002F\u002Fmarketplace.visualstudio.com\u002Fitems?itemName=esbenp.prettier-vscode)\n","SightFlow Desktop Agent 是一个基于大语言模型和视觉模型驱动的RPA工具，旨在通过AI技术实现自动化聊天回复与屏幕操作。其核心功能包括利用火山方舟API进行智能对话生成及视觉定位引导，支持自动识别或手动框选目标应用界面以优化布局测量。该工具特别适用于需要自动化处理即时通讯软件如微信、企业微信等场景中的消息回复任务。用户可以通过配置不同的AI提供商来定制具体的聊天分析和内容生成功能，使得SightFlow成为了一个灵活且强大的桌面端智能助手解决方案。",2,"2026-06-11 02:46:12","CREATED_QUERY"]