[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-5816":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":9,"language":10,"languages":9,"totalLinesOfCode":9,"stars":11,"forks":12,"watchers":13,"openIssues":14,"contributorsCount":14,"subscribersCount":14,"size":14,"stars1d":14,"stars7d":14,"stars30d":15,"stars90d":14,"forks30d":14,"starsTrendScore":14,"compositeScore":16,"rankGlobal":9,"rankLanguage":9,"license":9,"archived":17,"fork":17,"defaultBranch":18,"hasWiki":19,"hasPages":17,"topics":20,"createdAt":9,"pushedAt":9,"updatedAt":21,"readmeContent":22,"aiSummary":23,"trendingCount":14,"starSnapshotCount":14,"syncStatus":24,"lastSyncTime":25,"discoverSource":26},5816,"clawjuc","minknown\u002Fclawjuc","minknown","一个无需代码即可采集和监控网站的平台框架，关机也能采集，支持采集后的改写翻译等加工，图片视频可自动保存到OOS和本地，可以导出表格SQL等，也发布到各Wordpress等数十种博客平台，支持工作流8n8和数据开放API。",null,"TypeScript",160,17,12,0,88,49.57,false,"main",true,[],"2026-06-12 04:00:27","# 🕷️ Clawjub 采集平台\n\n> 新一代智能采集器 | 官网：[clawjuc.com](https:\u002F\u002Fclawjuc.com) | 社区交流：[clawjuc.com\u002Fhelp.php](https:\u002F\u002Fclawjuc.com\u002Fhelp.php)\n\nClawjub 是一款**无需编程**、**云端+本地双模式**的网站数据采集平台。无论你是数据分析师、运营人员，还是普通电脑用户，都能通过点选式操作完成复杂的数据采集任务。\n\n---\n\n## ✨ 视频简介\n\n通过5分钟快速了解平台功能：     \nhttps:\u002F\u002Fclawjuc.oss-cn-shanghai.aliyuncs.com\u002Fshort.mp4     \n演示一个任务的完整详细操作：    \nhttps:\u002F\u002Fclawjuc.oss-cn-shanghai.aliyuncs.com\u002Fclawjuc.mp4     \n\n## ✨ 核心能力\n\n- **内页的概念**：首先明白一个概念：新闻站详情页、视频站的具体播放页、资源内页、统一在系统内被称为成为内页。\n- **三种采集模式**，适配任何网页结构，可应对不同场景：\n\n  | 模式 | 适用场景 | 说明 |\n  |------|----------|------|\n  | **翻页采集** | 带页面\u002F列表栏目的网站 | 自动遍历多页，从页提取内页ID，再进入内页采集数据 |\n  | **内页采集** | 无分页，但内页ID递增或内页含内页的网站 | 适用于多数网站等 |\n  | **监控数据** | 固定页面变化监测 | 设定条件触发通知，如商品降价、内容更新 |\n\n不太理解的可以点此查看演示站：[clawjuc.com\u002Fdemo\u002F](https:\u002F\u002Fclawjuc.com\u002Fdemo\u002F)    \n\n---\n\n## 🚀 使用流程\n\n1. **填写目标网址与采集间隔**\n2. **通过「保存器」定义要采集的字段名**（列名）\n3. **提交任务，云端自动执行则无需下载软件，也可以下载软件本地采集**\n4. **可选择继续自动加工转化，之后导出或分发采集结果**\n\n---\n\n## 🧠 人工智能创新\n\n### 基于大语言模型（LLM）的智能采集\n- **代码模式**：支持自定义获取数据的过程，支持PHP和Python和JS三种编程语言，自由扩展，满足高级需求。\n- **零代码模式**：鼠标点选即可完成规则设定，无需编写代码，**电脑小白也能轻松上手**。\n（上述二选一即可）\n\n### 强大的加工脚本生态\n- 对采集后的数据进行二次加工：\n  - 文本分词\n  - 自动翻译\n  - AI智能改写\n  - 任意组合处理\n- **插件市场**：下载他人分享的脚本，也可自己编写上传。\n\n---\n## 🧠 媒体处理能力\n支持采集图片和视频，自动下载。    \n支持下载到Clawjuc云储存，或者阿里云OOS，或者本地电脑等三种数据保存方式。     \n在脚本市场中心还有各种去水印，加水印，视频转码，MP4切片，图片向量化等众多免费脚本安装即用，非常方便。    \n\n---\n\n## 📤 多种导出与分发方式\n\n| SQL, XLS, PDF, XML, JSON等常用文件格式    \n| 工作流自动通知（8n8、Zapier、邮件、Webhook等）    \n| API 实时分享采集结果（通过接口获取采集的数据）  \n| 使用内置脚本分发到Wordpress，Zblog等几十种博客论坛平台    \n\n\n---\n\n## ☁️ 云端 + 本地双模式\n\n- **云端采集**：关机照常运行，7×24小时不间断执行任务。\n- **本地模式**：适合内网环境或本地调试，保护采集私密性。\n\n---\n\n## 🔒 高级特性\n\n- ✅ **支持登录后采集**（Cookie\u002FSession 维持）\n- ✅ **多IP轮换** + **多指纹浏览器**（反反爬、分布式采集）\n- ✅ **无限制**：存储空间不限，采集条数不限\n\n---\n\n## 🔗 链接\n\n- 官方网站：[https:\u002F\u002Fclawjuc.com](https:\u002F\u002Fclawjuc.com)\n- 论坛帮助 & 交流：[https:\u002F\u002Fclawjuc.com\u002Fhelp.php](https:\u002F\u002Fclawjuc.com\u002Fhelp.php)\n\n> 📌 如有疑问或建议，欢迎访问论坛参与讨论。  \n> 🎉 Clawjuc — 让数据采集变得前所未有的简单。\n\n\n## 🔗 部分图片\n\n![一张风景照](image\u002Fa.png)  \n![一张风景照](image\u002Fd.png)   \n![一张风景照](image\u002Fv.png)   \n\n","Clawjuc 是一个无需编程即可实现网站数据采集和监控的平台框架。其核心功能包括支持三种采集模式（翻页采集、内页采集、监控数据），能够处理图片和视频并自动保存到OOS或本地，同时提供强大的数据加工能力如文本分词、自动翻译及AI智能改写等。此外，Clawjuc还允许用户通过内置脚本将数据导出为多种格式或直接分发至Wordpress等多种博客平台，并开放了API接口供进一步开发使用。该平台适用于需要从网页获取信息但又不具备编程能力的数据分析师、运营人员以及普通电脑用户，在云端+本地双模式下运行，确保即使在关机状态下也能持续进行数据采集任务。",2,"2026-06-11 03:05:06","CREATED_QUERY"]