[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-4082":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":16,"stars7d":17,"stars30d":18,"stars90d":16,"forks30d":16,"starsTrendScore":16,"compositeScore":19,"rankGlobal":10,"rankLanguage":10,"license":20,"archived":21,"fork":21,"defaultBranch":22,"hasWiki":23,"hasPages":21,"topics":24,"createdAt":10,"pushedAt":10,"updatedAt":33,"readmeContent":34,"aiSummary":35,"trendingCount":16,"starSnapshotCount":16,"syncStatus":17,"lastSyncTime":36,"discoverSource":37},4082,"spider-flow","ssssssss-team\u002Fspider-flow","ssssssss-team","新一代爬虫平台，以图形化方式定义爬虫流程，不写代码即可完成爬虫。","https:\u002F\u002Fwww.spiderflow.org",null,"Java",11325,2179,99,11,0,2,15,45,"MIT License",false,"master",true,[25,26,27,5,28,29,30,31,32],"crawler","jsoup","spider","web-crawler","web-spider","webcrawler","webspider","xpath","2026-06-12 02:00:58","\u003Cp align=\"center\">\r\n    \u003Cimg src=\"https:\u002F\u002Fwww.spiderflow.org\u002Fimages\u002Flogo.svg\" width=\"600\">\r\n\u003C\u002Fp>\r\n\u003Cp align=\"center\">\r\n    \u003Ca target=\"_blank\" href=\"https:\u002F\u002Fwww.oracle.com\u002Ftechnetwork\u002Fjava\u002Fjavase\u002Fdownloads\u002Findex.html\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FJDK-1.8+-green.svg\" \u002F>\u003C\u002Fa>\r\n    \u003Ca target=\"_blank\" href=\"https:\u002F\u002Fwww.spiderflow.org\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FDocs-latest-blue.svg\"\u002F>\u003C\u002Fa>\r\n    \u003Ca target=\"_blank\" href=\"https:\u002F\u002Fgithub.com\u002Fssssssss-team\u002Fspider-flow\u002Freleases\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fv\u002Frelease\u002Fssssssss-team\u002Fspider-flow?logo=github\">\u003C\u002Fa>\r\n    \u003Ca target=\"_blank\" href='https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow'>\u003Cimg src=\"https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow\u002Fbadge\u002Fstar.svg?theme=white\" \u002F>\u003C\u002Fa>\r\n    \u003Ca target=\"_blank\" href='https:\u002F\u002Fgithub.com\u002Fssssssss-team\u002Fspider-flow'>\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Fstars\u002Fssssssss-team\u002Fspider-flow.svg?style=social\"\u002F>\u003C\u002Fa>\r\n    \u003Ca target=\"_blank\" href=\"LICENSE\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002F:license-MIT-blue.svg\">\u003C\u002Fa>\r\n    \u003Ca target=\"_blank\" href=\"https:\u002F\u002Fshang.qq.com\u002Fwpa\u002Fqunwpa?idkey=10faa4cf9743e0aa379a72f2ad12a9e576c81462742143c8f3391b52e8c3ed8d\">\u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FJoin-QQGroup-blue\">\u003C\u002Fa>\r\n\u003C\u002Fp>\r\n\r\n[介绍](#介绍) | [特性](#特性) | [插件](#插件) | \u003Ca target=\"_blank\" href=\"http:\u002F\u002Fdemo.spiderflow.org\">DEMO站点\u003C\u002Fa> | \u003Ca target=\"_blank\" href=\"https:\u002F\u002Fwww.spiderflow.org\">文档\u003C\u002Fa> | \u003Ca target=\"_blank\" href=\"https:\u002F\u002Fwww.spiderflow.org\u002Fchangelog.html\">更新日志\u003C\u002Fa> | [截图](#项目部分截图) | [其它开源](#其它开源项目) | [免责声明](#免责声明)\r\n\r\n## 介绍\r\n平台以流程图的方式定义爬虫,是一个高度灵活可配置的爬虫平台\r\n\r\n## 特性\r\n- [x] 支持Xpath\u002FJsonPath\u002Fcss选择器\u002F正则提取\u002F混搭提取\r\n- [x] 支持JSON\u002FXML\u002F二进制格式\r\n- [x] 支持多数据源、SQL select\u002FselectInt\u002FselectOne\u002Finsert\u002Fupdate\u002Fdelete\r\n- [x] 支持爬取JS动态渲染(或ajax)的页面\r\n- [x] 支持代理\r\n- [x] 支持自动保存至数据库\u002F文件\r\n- [x] 常用字符串、日期、文件、加解密等函数\r\n- [x] 支持插件扩展(自定义执行器，自定义方法）\r\n- [x] 任务监控,任务日志\r\n- [x] 支持HTTP接口\r\n- [x] 支持Cookie自动管理\r\n- [x] 支持自定义函数\r\n\r\n## 插件\r\n- [x] [Selenium插件](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow-selenium)\r\n- [x] [Redis插件](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow-redis)\r\n- [x] [OSS插件](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow-oss)\r\n- [x] [Mongodb插件](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow-mongodb)\r\n- [x] [IP代理池插件](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow-proxypool)\r\n- [x] [OCR识别插件](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow-ocr)\r\n- [x] [电子邮箱插件](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow-mailbox)\r\n\r\n## 项目部分截图\r\n### 爬虫列表\r\n![爬虫列表](https:\u002F\u002Fimages.gitee.com\u002Fuploads\u002Fimages\u002F2020\u002F0412\u002F104521_e1eb3fbb_297689.png \"list.png\")\r\n### 爬虫测试\r\n![爬虫测试](https:\u002F\u002Fimages.gitee.com\u002Fuploads\u002Fimages\u002F2020\u002F0412\u002F104659_b06dfbf0_297689.gif \"test.gif\")\r\n### Debug\r\n![Debug](https:\u002F\u002Fimages.gitee.com\u002Fuploads\u002Fimages\u002F2020\u002F0412\u002F104741_f9e1190e_297689.png \"debug.png\")\r\n### 日志\r\n![日志](https:\u002F\u002Fimages.gitee.com\u002Fuploads\u002Fimages\u002F2020\u002F0412\u002F104800_a757f569_297689.png \"logo.png\")\r\n\r\n## 其它开源项目\r\n- [spider-flow-vue，spider-flow的前端](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fspider-flow-vue)\r\n- [magic-api，一个以XML为基础自动映射为HTTP接口的框架](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fmagic-api)\r\n- [magic-api-spring-boot-starter](https:\u002F\u002Fgitee.com\u002Fssssssss-team\u002Fmagic-api-spring-boot-starter)\r\n\r\n\r\n## 免责声明\r\n请勿将`spider-flow`应用到任何可能会违反法律规定和道德约束的工作中，请友善使用`spider-flow`，遵守蜘蛛协议，不要将`spider-flow`用于任何非法用途。如您选择使用`spider-flow`即代表您遵守此协议，作者不承担任何由于您违反此协议带来任何的法律风险和损失，一切后果由您承担。\r\n","spider-flow 是一个新一代的爬虫平台，通过图形化界面定义爬虫流程，无需编写代码即可完成数据抓取任务。其核心功能包括支持多种数据提取方式（如XPath、JsonPath、CSS选择器等）、处理动态页面内容、多数据源操作及自动保存结果至数据库或文件等，并且具备强大的插件扩展能力，允许用户自定义执行器和方法。此外，该平台还提供了任务监控与日志记录等功能，确保了爬虫运行过程中的透明度与可控性。适用于需要频繁进行网页信息采集但又不想深入编程细节的场景，如市场调研、竞品分析等领域。","2026-06-11 02:58:17","top_language"]