[发明专利]一种网页分割的方法及装置有效

专利信息
申请号: 201210579176.8 申请日: 2012-12-27
公开(公告)号: CN103078910A 公开(公告)日: 2013-05-01
发明(设计)人: 郑国东;黄龙 申请(专利权)人: 华为技术有限公司
主分类号: H04L29/08 分类号: H04L29/08;H04L29/12
代理公司: 深圳中一专利商标事务所 44237 代理人: 张全文
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网页 分割 方法 装置
【说明书】:

技术领域

发明属于互联网技术领域,尤其涉及一种网页分割的方法及装置。

背景技术

网页分割技术是指将一次网页点击操作产生的多个HTTP(Hypertext Transport Protocol,超文本传送协议)报文(GET报文或POST报文)关联起来的技术,通过这种技术,可以区分对不同网页所进行的点击操作或者对同一网页所进行的不同的点击操作。

现有技术一般通过时间戳对网页进行分割。具体地,监控中心通过采集探针获取客户端发送的HTTP报文后,把所述HTTP报文中源IP地址相同的HTTP报文按照时间戳(例如,获取HTTP报文时的时间戳)进行排序,若两个相邻的HTTP报文之间的时间差(即两个HTTP报文的时间戳之间的时间间隔)小于第一预设阈值(例如,2秒),则确定这两个相邻的HTTP报文是同一次点击操作生成的报文;若这两个相邻的HTTP报文之间的时间差大于第二预设阈值(例如,5秒),则确定这两个相邻的HTTP报文不是同一次点击操作所生成的报文;若这两个相邻的HTTP报文之间的时间差在第一预设阈值与第二预设阈值之间,则需要进一步判断这两个相邻的HTTP报文的参考(Reference)地址、主机(Host)地址以及通用资源标识符(Uniform Resource Identifier,URI)地址是否相同,如果相同,则确定这两个相邻的HTTP报文是同一次点击操作所生成的报文。

然而,现有技术存在以下问题:1)采用时间差的方式判断HTTP报文是否是同一次点击操作所生产的报文是不准确的,现在很多的智能终端(例如四核智能手机等)都可以并行打开多个浏览器窗口,用户有可能在相距很短的时间进行多次点击操作,根据时间差来判断是否为同一次点击操作生成的网页不够准确;2)现有技术中,同一网页中的各个关系对象(例如图片、音视频等)的Reference地址、Host地址或URI地址有可能是不同的,因此通过Reference地址、Host地址以及URI地址来判断HTTP报文是否是同一次点击操作所生成的报文也不够准确。

发明内容

本发明实施例的目的在于提供一种网页分割的方法,以便监控中心能够准确地对网页进行分割。

第一方面,一种网页分割的方法,所述方法包括:

获取客户端发送的超文本传输协议HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作;

判断所述HTTP报文中源网际协议IP地址相同的HTTP报文所携带的操作标识是否相同;

若所述源IP地址相同的HTTP报文携带的操作标识相同,则确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文。

在第一方面的第一种可能的实现方式中,所述方法还包括:

若所述源IP地址相同的HTTP报文携带的操作标识不同,则确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。

结合第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,在所述判断所述HTTP报文中源IP地址相同的HTTP报文所携带的操作标识是否相同之前,所述方法还包括:

根据源IP地址,对所述客户端发送的HTTP报文进行分类。

结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,在所述根据源IP地址,对所述客户端发送的HTTP报文进行分类之后,所述方法还包括:

按照时间戳的大小,对分类后的HTTP报文进行排序,其中,所述时间戳为获取所述HTTP报文时的时间戳或所述客户端发送所述HTTP报文时的时间戳。

结合第一方面或第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式或第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述HTTP报文包括GET报文或POST报文。

第二方面,一种网页分割的装置,所述装置包括:

报文获取单元,用于获取客户端发送的超文本传输协议HTTP报文,所述HTTP报文携带操作标识,所述操作标识用于标识发送所述HTTP报文时的点击操作;

判断单元,用于判断所述报文获取单元获取的HTTP报文中源网际协议IP地址相同的HTTP报文所携带的操作标识是否相同;

确定单元,用于在所述判断单元判断结果为是时,确定所述源IP地址相同的HTTP报文是同一次点击操作所生成的报文。

在第二方面的第一种可能的实现方式中,所述确定单元还用于在所述判断单元判断结果为否时,确定所述源IP地址相同的HTTP报文不是同一次点击操作所生成的报文。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210579176.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top