[发明专利]一种反爬虫处理方法、系统、存储介质及电子设备在审
申请号: | 202111299496.3 | 申请日: | 2021-11-04 |
公开(公告)号: | CN113961788A | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 梁志勇 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06F16/957;G06F16/958 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 钱娜 |
地址: | 100000 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 爬虫 处理 方法 系统 存储 介质 电子设备 | ||
1.一种反爬虫处理方法,其特征在于,所述方法包括:
当接收到网络爬虫访问预先生成的各个隐蔽链接中的任意一个隐蔽链接产生的访问请求时,获取所述网络爬虫访问隐蔽链接时所使用的IP;所述各个隐蔽链接隐藏于HTML网页文件中;
通过预设IP风险情报库对所述IP进行风险识别,得到风险识别结果;所述风险识别结果用于指示所述IP对应的风险等级;
基于所述风险识别结果执行对应的操作。
2.根据权利要求1所述的方法,其特征在于,各个隐蔽链接的生成过程,包括:
通过随机链接生成服务,对HTML网页文件中的各个URL链接进行遍历,随机生成各个待处理链接;
对所述各个待处理链接进行隐蔽处理,得到各个隐蔽链接。
3.根据权利要求2所述的方法,其特征在于,在所述对所述各个待处理链接进行隐蔽处理,得到各个隐蔽链接之后,还包括:
对包含所述各个隐蔽链接的HTML网页文件进行自动化测试。
4.根据权利要求1所述的方法,其特征在于,所述通过预设IP风险情报库对所述IP进行风险识别,得到风险识别结果,包括:
从预设IP风险情报库中获取预设风险等级;所述预设风险等级包括高风险等级、中高风险等级、中风险等级、中低风险等级、低风险等级和无风险等级;
通过所述预设风险等级对所述IP对应的风险等级进行评分;
和/或,若所述IP对应的风险等级的评分为第一评分,则确定所述IP对应的风险等级为所述高风险等级;
和/或,若所述IP对应的风险等级的评分为第二评分,则确定所述IP对应的风险等级为所述中高风险等级;
和/或,若所述IP对应的风险等级的评分为第三评分,则确定所述IP对应的风险等级为所述中风险等级;
和/或,若所述IP对应的风险等级的评分为第四评分,则确定所述IP对应的风险等级为所述中低风险等级;
和/或,若所述IP对应的风险等级的评分为第五评分,则确定所述IP对应的风险等级为所述低风险等级;
和/或,若所述IP对应的风险等级的评分为第六评分,则确定所述IP对应的风险等级为所述无风险等级。
5.根据权利要求4所述的方法,其特征在于,所述基于所述风险识别结果执行对应的操作,包括:
若所述IP对应的风险等级为所述高风险等级或者所述中高风险等级,则对所述IP进行拦截;
若所述IP对应的风险等级为所述中风险等级、所述中低风险等级或所述低风险等级中的任意一种,则执行验证码验证操作。
6.一种反爬虫处理系统,其特征在于,所述系统包括:
获取单元,用于当接收到网络爬虫访问预先生成的各个隐蔽链接中的任意一个隐蔽链接产生的访问请求时,获取所述网络爬虫访问隐蔽链接时所使用的IP;所述各个隐蔽链接隐藏于HTML网页文件中;
识别单元,用于通过预设IP风险情报库对所述IP进行风险识别,得到风险识别结果;所述风险识别结果用于指示所述IP对应的风险等级;
执行单元,用于基于所述风险识别结果执行对应的操作。
7.根据权利要求6所述的系统,其特征在于,各个隐蔽链接的生成过程的所述获取单元,包括:
遍历模块,用于通过随机链接生成服务,对HTML网页文件中的各个URL链接进行遍历,随机生成各个待处理链接;
处理模块,用于对所述各个待处理链接进行隐蔽处理,得到各个隐蔽链接。
8.根据权利要求7所述的系统,其特征在于,还包括:
测试单元,用于对包含所述各个隐蔽链接的HTML网页文件进行自动化测试。
9.一种存储介质,其特征在于,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如权利要求1至5任意一项所述的反爬虫处理方法。
10.一种电子设备,其特征在于,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如权利要求1至5任意一项所述的反爬虫处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111299496.3/1.html,转载请声明来源钻瓜专利网。