# spider-flow
**Repository Path**: reedsource/spider-flow
## Basic Information
- **Project Name**: spider-flow
- **Description**: 在原有spider-flow图形化爬虫基础上,更新jdk17,把项目融合为不分离thymeleaf项目,更利于后端同学学习使用。
- **Primary Language**: Java
- **License**: MIT
- **Default Branch**: master
- **Homepage**: https://www.spiderflow.org
- **GVP Project**: No
## Statistics
- **Stars**: 1
- **Forks**: 4126
- **Created**: 2022-08-21
- **Last Updated**: 2025-01-26
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
[介绍](#介绍) | [特性](#特性) | [插件](#插件) | DEMO站点 | 文档 | 更新日志 | [截图](#项目部分截图) | [其它开源](#其它开源项目) | [免责声明](#免责声明)
## 介绍
平台以流程图的方式定义爬虫,是一个高度灵活可配置的爬虫平台
## 更新日志
- 202209
- 更新jdk为jdk17
- 合并应用为单体应用
- 引入thymeleaf,变更项目为标准的springboot web项目,便于融入其他项目
- 20220924
- 写于最后
- 这个爬虫项目算是我翻遍gitee界面最符合我的需求的,非常棒
- 最近在复习若依框架,需要一个好的爬虫模块,最后找到了这个
- 断断续续花了些时间把这个做成一个模块,看起来已经可以很容易的融入若依的大模块了,也算是功成生退了
- 后来者,编程之路,与诸君共勉
## 特性
- [x] 支持Xpath/JsonPath/css选择器/正则提取/混搭提取
- [x] 支持JSON/XML/二进制格式
- [x] 支持多数据源、SQL select/selectInt/selectOne/insert/update/delete
- [x] 支持爬取JS动态渲染(或ajax)的页面
- [x] 支持代理
- [x] 支持自动保存至数据库/文件
- [x] 常用字符串、日期、文件、加解密等函数
- [x] 支持插件扩展(自定义执行器,自定义方法)
- [x] 任务监控,任务日志
- [x] 支持HTTP接口
- [x] 支持Cookie自动管理
- [x] 支持自定义函数
## 插件
- [x] [Selenium插件](https://gitee.com/ssssssss-team/spider-flow-selenium)
- [x] [Redis插件](https://gitee.com/ssssssss-team/spider-flow-redis)
- [x] [OSS插件](https://gitee.com/ssssssss-team/spider-flow-oss)
- [x] [Mongodb插件](https://gitee.com/ssssssss-team/spider-flow-mongodb)
- [x] [IP代理池插件](https://gitee.com/ssssssss-team/spider-flow-proxypool)
- [x] [OCR识别插件](https://gitee.com/ssssssss-team/spider-flow-ocr)
- [x] [电子邮箱插件](https://gitee.com/ssssssss-team/spider-flow-mailbox)
## 项目部分截图
### 爬虫列表

### 爬虫测试

### Debug

### 日志

## 其它开源项目
- [spider-flow-vue,spider-flow的前端](https://gitee.com/ssssssss-team/spider-flow-vue)
- [magic-api,一个以XML为基础自动映射为HTTP接口的框架](https://gitee.com/ssssssss-team/magic-api)
- [magic-api-spring-boot-starter](https://gitee.com/ssssssss-team/magic-api-spring-boot-starter)
## 免责声明
请勿将`spider-flow`应用到任何可能会违反法律规定和道德约束的工作中,请友善使用`spider-flow`,遵守蜘蛛协议,不要将`spider-flow`用于任何非法用途。如您选择使用`spider-flow`即代表您遵守此协议,作者不承担任何由于您违反此协议带来任何的法律风险和损失,一切后果由您承担。