• 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏ITPCB吧

spiderflow新一代高度灵活可配置的爬虫平台!

开源项目 一叶知秋 2周前 (06-29) 52次浏览 0个评论

介绍

平台以流程图的方式定义爬虫,是一个高度灵活可配置的爬虫平台

  • 支持Xpath/JsonPath/css选择器/正则提取/混搭提取
  • 支持JSON/XML/二进制格式
  • 支持多数据源、SQL select/selectInt/selectOne/insert/update/delete
  • 支持爬取JS动态渲染(或ajax)的页面
  • 支持代理
  • 支持自动保存至数据库/文件
  • 常用字符串、日期、文件、加解密等函数
  • 支持插件扩展(自定义执行器,自定义方法)
  • 任务监控,任务日志
  • 支持HTTP接口
  • 支持Cookie自动管理
  • 支持自定义函数

插件

项目部分截图

爬虫列表

爬虫测试

Debug

日志

项目地址

官方网站:https://www.spiderflow.org/


ITPCB版权所有 , 如未注明 , 均为原创 , 本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:http://www.itpcb.com/a/0629133.html
喜欢 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址