[发明专利]URL点击事件的识别方法、装置和服务器有效
| 申请号: | 201210277209.3 | 申请日: | 2012-08-06 |
| 公开(公告)号: | CN103581263A | 公开(公告)日: | 2014-02-12 |
| 发明(设计)人: | 杨建平 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | H04L29/08 | 分类号: | H04L29/08 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | url 点击 事件 识别 方法 装置 服务器 | ||
技术领域
本发明涉及通信技术,尤其涉及一种统一资源定位符(Uniform/Universal Resource Locator;简称:URL)点击事件的识别方法、装置和服务器。
背景技术
当前基于超文本传送协议(Hypertext Transport Protocol;简称:HTTP)的应用越来越广泛,且考虑到web安全问题,需要了解用户的访问情况,即了解用户的URL点击事件,以根据用户的URL点击事件对用户的行为进行分析。其中,该URL点击事件是指一个人通过点击浏览器所展示的网页中的链接,进而访问与该链接对应的URL所定位的资源的事件。
但是,由于现有技术网页设计越来越复杂,例如:网页互相嵌套、页面的重定向(如访问google搜索结果都会重定向一次)、广告推送服务、应用软件消息和升级服务器等,因此,直接通过HTTP GET报文个数并不能准确反映用户的URL点击事件,从而也就无法准确地对用户的行为进行分析。
发明内容
本发明提供一种URL点击事件的识别方法、装置和服务器,用于解决现有技术中URL点击事件识别不准确的问题。
本发明的第一个方面是提供一种URL点击事件的识别方法,包括:
接收第一HTTP请求报文,提取所述第一HTTP请求报文的报文头中的属性信息;
在所述属性信息满足预先配置的流规则组中的流规则时,根据所满足的流规则对应的权值,对所述第一HTTP请求报文进行评分处理,获取所述第一HTTP请求报文对应的第一总评分;
在所述属性信息满足预先配置的报文规则组中的报文规则时,根据所满足的报文规则对应的权值,对所述第一HTTP请求报文进行评分处理,获取所述第一HTTP请求报文对应的第二总评分;
在所述第一总评分和第二总评分之和大于或等于点击事件评分阈值时,识别出发生URL点击事件。
在第一方面的第一种可能的实现方式中,所述在所述属性信息满足预先配置的流规则组中的流规则时,根据所满足的流规则对应的权值,对所述第一HTTP请求报文进行评分处理,获取所述第一HTTP请求报文对应的第一总评分,包括:
判断所述属性信息是否满足所述流规则组中的第一流规则;所述第一流规则为所述属性信息中的五元组信息与当前存储的五元组信息相同,所述当前存储的五元组信息是指承载第二HTTP请求报文的数据流的五元组信息,所述第二HTTP请求报文为所述第一HTTP请求报文的上一次请求报文;
若判断出所述属性信息满足所述第一流规则,则根据所述第一流规则对应的第一权值,对所述第一HTTP请求报文进行评分处理,获取第一HTTP请求报文对应的第一评分;
判断所述属性信息是否满足所述流规则组中的第二流规则,所述第二流规则为所述第一HTTP请求报文的访问时间与所述第二HTTP请求报文的访问时间之差大于HTTP请求报文访问间隔阈值;
若判断出所述属性信息满足所述第二流规则,则根据所述第二流规则对应的第二权值,对所述第一HTTP请求报文进行评分处理,获取所述第一HTTP请求报文对应的第二评分。
在第一方面的第一种可能实现方式,还提供了第一方面的第二种可能的实现方式,所述判断所述属性信息是否满足所述流规则组中的第一流规则之后,所述方法还包括:
若判断出所述属性信息不满足所述流规则组中的第一流规则,则判断所述属性信息是否满足所述流规则组中的第三流规则,所述第三流规则为承载所述第一HTTP请求报文的数据流的访问时间和承载所述第二HTTP请求报文的数据流的访问时间之差小于等于流访问的间隔阈值;
若判断所述属性信息满足所述第三流规则,则根据所述第三流规则对应的第三权值,对所述第一HTTP请求报文进行评分处理,获取第一HTTP请求报文对应的第三评分。
在第一方面、第一方面的第一种或者第一方面的第二种可能实现方式中,还提供了第一方面的第三种可能实现方式,所述报文规则组包括如下的一种规则或者几种规则的组合:所述属性信息中的URL包含在预先配置的URL点击黑名单中;所述属性信息中的URL的扩展名包含在预先配置的扩展名黑名单中;属于浏览器访问;以及存在关联网站且第一HTTP请求报文所在流的关联时间和所述关联网站所在流的关联时间之差大于关联阈值。
在第一方面的第三种可能实现方式中,还提供了第一方面的第四种可能实现方式,所述识别出发生URL点击事件之后,所述方法还包括:
记录所述第一HTTP请求报文的访问时间;
记录所述第一HTTP请求报文所承载的数据流的访问时间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210277209.3/2.html,转载请声明来源钻瓜专利网。





