[发明专利]一种数据探测方法及装置有效
申请号: | 202010627728.2 | 申请日: | 2020-07-02 |
公开(公告)号: | CN111737629B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 田启航;王滨;万里;毕志城;周少鹏 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/955;G06F16/951 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 杨春香 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 探测 方法 装置 | ||
本申请提供一种数据探测方法及装置,所述方法应用于爬虫系统,所述爬虫系统包括爬虫节点、代理节点,所述方法包括:所述代理节点在检测到数据探测任务时,建立所述代理节点与客户端的代理关系;在通过所述爬虫节点执行所述数据探测任务时,触发所述客户端通过所述代理节点向被测系统发送请求信息,其中,所述被测系统响应所述请求信息产生交互数据;所述代理节点捕获所述客户端的请求信息和所述被测系统的交互数据。应用该方法,可以实现对被测系统进行全面探测。
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据探测方法及装置。
背景技术
目前,可以通过浏览器与网站进行交互获取网站的数据,这里,网站的数据可以是网站提供的静态网页、采用后端渲染方式渲染而成的网页,或者针对浏览器发送的AJAX请求而返回的AJAX响应数据,其中,当浏览器获取到网站的AJAX响应数据后,采用前端渲染方式对获取到的数据进行渲染而生成网页。进而,通过爬虫以获取网页内容的方式实现对网站的探测。
可见,传统的爬虫探测到的仅仅是网页内容,并无法探测到浏览器与网站交互过程中的原始交互数据,比如浏览器向网站发送的AJAX请求、网站向浏览器返回的AJAX响应数据等,这就导致应用目前的数据探测方法无法对被测系统进行全面探测。
发明内容
有鉴于此,本申请提供一种数据探测方法及装置,以解决应用目前的数据探测方法无法对被测系统进行全面探测的问题。
根据本申请实施例的第一方面,提供一种数据探测方法,应用于爬虫系统,所述爬虫系统包括爬虫节点、代理节点,所述数据探测方法包括:
所述代理节点在检测到数据探测任务时,建立所述代理节点与客户端的代理关系;
在通过所述爬虫节点执行所述数据探测任务时,触发所述客户端通过所述代理节点向被测系统发送请求信息,其中,所述被测系统响应所述请求信息产生交互数据;
所述代理节点捕获所述客户端的请求信息和所述被测系统的交互数据。
可选的,所述爬虫节点执行所述数据探测任务,包括:
所述爬虫节点从所述数据探测任务的任务信息中获取被测系统的根URL地址;
所述爬虫节点触发所述客户端通过所述代理节点基于所述根URL地址向被测系统发送请求信息,其中,所述请求信息用于请求获取所述被测系统的页面资源,所述被测系统响应所述请求信息向所述客户端返回页面资源。
可选的,所述爬虫节点触发所述客户端通过所述代理节点基于所述根URL地址向被测系统发送请求信息,包括:
所述爬虫节点将所述根URL地址作为当前URL地址,触发所述客户端通过所述代理节点向所述被测系统发送针对当前URL地址的访问请求,其中,所述被测系统响应所述针对当前URL地址的访问请求向客户端返回所述当前URL地址的页面资源;
所述爬虫节点爬取所述页面资源中包含的URL地址;
所述爬虫节点检查爬取的URL地址中是否存在未被访问过的URL地址;如果是,则选择任意一个未被访问过的URL地址作为当前URL地址,返回执行所述触发所述客户端通过所述代理节点向被测系统发送针对当前URL地址的访问请求,直至爬取的URL地址中不存在未被访问过的URL地址。
可选的,所述方法还包括:
所述爬虫节点爬取所述页面资源中包含的表单元素;
所述爬虫节点基于爬取的表单元素触发所述客户端通过所述代理节点向所述被测系统发送AJAX请求报文,其中,所述被测系统响应所述AJAX请求报文向所述客户端返回AJAX响应报文。
可选的,在所述爬虫节点从所述数据探测任务的任务信息中获取被测系统的根URL地址之前,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010627728.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种传动稳定的链轮
- 下一篇:一种室间隔穿孔封堵装置及其使用方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置