[发明专利]异常访问请求识别方法及装置有效
申请号: | 201610045718.1 | 申请日: | 2016-01-22 |
公开(公告)号: | CN106998317B | 公开(公告)日: | 2019-08-20 |
发明(设计)人: | 王星;童遥 | 申请(专利权)人: | 高德信息技术有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京领科知识产权代理事务所(特殊普通合伙) 11690 | 代理人: | 张丹 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 访问 请求 识别 方法 装置 | ||
本申请提供了一种异常访问请求识别方法及装置,所述方法包括:接收携带IP地址及访问时间的访问请求;识别所述IP地址所属的IP地址段;所述IP地址段包含至少一个IP地址;将所述IP地址段及访问时间输入频次阈值确定模型,得到所述模型输出的访问频次阈值;其中,所述频次阈值确定模型采用机器学习的方法训练获得;获取所述访问时间对应的预设时长内携带所述IP地址段包含的IP地址的访问请求的访问频次;判断所述访问时间对应的预设时长内携带所述IP地址段包含的IP地址的访问请求的访问频次是否超过所确定的访问频次阈值;若超过所述访问频次阈值,则识别出携带所述IP地址的访问请求为异常访问请求。本申请实现了准确、有效的识别及防止数据抓取操作。
技术领域
本申请涉及互联网技术领域,尤其涉及一种异常访问请求识别方法及装置。
背景技术
异常访问请求识别是各个互联网数据服务保护数据、防止恶意抓取的必要操作。现有的异常访问请求识别方法一般是通过访问频次限制来实现。通过为所有IP地址设置统一的访问频次阈值,在携带同一IP地址的访问请求的访问频次超过该访问频次阈值时,则认为携带该IP地址的访问请求为异常访问请求,将该IP地址封禁,拒绝携带该IP地址的所有访问请求,以达到数据防抓取的目的。
并且,考虑到异常访问请求的访问频次相对较高,因此,现有技术设置的访问频次阈值是一个相对较高的值,但在实际应用中,发明人发现现实情况也存在部分异常访问请求为低频访问,在这种情况下,通过现有的访问频次阈值并不能识别出低频的异常访问请求。若为解决该问题而将访问频次阈值降低,会产生将真实用户的正常数据访问请求误认为是异常访问请求的问题,从而影响真实用户的正常数据访问操作。因此,现有的异常访问请求识别方法无法识别出所有可能的异常访问请求,从而出现无法全面有效地阻止来自异常访问请求的数据抓取操作。
发明内容
本申请解决的技术问题之一是,提供一种异常访问请求识别方法及装置,实现了准确、有效的识别异常访问请求。
根据本申请一方面的一个实施例,提供了一种异常访问请求识别方法,包括:
接收携带IP地址及访问时间的访问请求;
识别所述IP地址所属的IP地址段;所述IP地址段包含至少一个IP地址;
将所述IP地址段及访问时间输入频次阈值确定模型,得到所述模型输出的访问频次阈值;其中,所述频次阈值确定模型采用机器学习的方法训练获得;
获取所述访问时间对应的预设时长内携带所述IP地址段包含的IP地址的访问请求的访问频次;
判断所述访问时间对应的预设时长内携带所述IP地址段包含的IP地址的访问请求的访问频次是否超过所确定的访问频次阈值;
若超过所述访问频次阈值,则识别出携带所述IP地址的访问请求为异常访问请求。
根据本申请另一方面的一个实施例,提供了一种异常访问请求识别装置,包括:
接收单元,用于接收携带IP地址及访问时间的访问请求;
地址段识别单元,用于识别所述IP地址所属的IP地址段;所述IP地址段包含至少一个IP地址;
确定单元,用于将所述IP地址段及访问时间输入频次阈值确定模型,得到所述模型输出的访问频次阈值;其中,所述频次阈值确定模型采用机器学习的方法训练获得;
获取单元,用于获取所述访问时间对应的预设时长内携带所述IP地址段包含的IP地址的访问请求的访问频次;
判断单元,用于判断所述访问时间对应的预设时长内携带所述IP地址段包含的IP地址的访问请求的访问频次是否超过所确定的访问频次阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高德信息技术有限公司,未经高德信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610045718.1/2.html,转载请声明来源钻瓜专利网。