[发明专利]一种确定网页打开时间的方法及装置有效
| 申请号: | 201510431503.9 | 申请日: | 2015-07-21 |
| 公开(公告)号: | CN104991957B | 公开(公告)日: | 2018-08-07 |
| 发明(设计)人: | 李宜明;王立俊;丁文涛 | 申请(专利权)人: | 北京润通丰华科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 刘杰 |
| 地址: | 100093 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 确定 网页 打开 时间 方法 装置 | ||
1.一种确定网页打开时间的方法,其特征在于,所述方法包括:
获取域名系统服务器中的日志信息,其中,所述日志信息包含至少一个用户的网络协议地址和所述至少一个用户访问第一网页时所产生的域名信息;
利用MapReduce模型对所述日志信息进行分析,确定所述至少一个用户访问所述第一网页的平均打开时间;
其中,所述利用MapReduce模型对所述日志信息进行分析,具体包括:
基于所述日志信息,确定所述第一网页所对应的首域名段和尾域名段;
执行所述MapReduce模型中的Map处理过程,确定与所述首域名段对应的起始时间和与所述尾域名段对应的终止时间;
执行所述MapReduce模型中的Reduce处理过程,基于所述起始时间和所述终止时间,确定所述至少一个用户访问所述第一网页的平均打开时间。
2.如权利要求1所述的方法,其特征在于,所述执行所述MapReduce模型中的Map处理过程,确定与所述首域名段对应的起始时间和与所述尾域名段对应的终止时间,具体包括:
基于所述首域名段中各个首域名的访问时间,依照时间先后顺序,判断相邻的两个首域名之间的第一时间间隔是否满足第一预设时间范围;
若所述第一时间间隔满足所述第一预设时间范围,则确定所述各个首域名的访问时间中最早的访问时间为所述起始时间;以及
基于所述尾域名段中各个尾域名的访问时间,依照时间先后顺序,判断相邻的两个尾域名之间的第二时间间隔是否满足第二预设时间范围;
若所述第二时间间隔满足所述第二预设时间范围,则确定所述各个尾域名的访问时间中最晚的访问时间为所述终止时间。
3.如权利要求1所述的方法,其特征在于,所述执行所述MapReduce模型中的Reduce处理过程,基于所述起始时间和所述终止时间,确定所述至少一个用户访问所述第一网页的平均打开时间,具体包括:
针对同一用户,基于重复访问所述第一网页获得的i个所述起始时间和j个所述终止时间,依照时间先后顺序,获得倒序排列的起始时间队列和终止时间队列;
基于所述起始时间队列和所述终止时间队列,确定所述至少一个用户访问所述第一网页的平均打开时间。
4.如权利要求3所述的方法,其特征在于,所述基于所述起始时间队列和所述终止时间队列,确定所述至少一个用户访问所述第一网页的平均打开时间,具体包括:
通过迭代判断所述终止时间队列中的第一个元素与所述起始时间队列中的第一个元素之间的时间差值是否满足预设有效时间范围,获得至少一个所述时间差值为有效时间差值;
基于至少一个所述有效时间差值和所述有效时间差值的数量,确定所述至少一个用户访问所述第一网页的平均打开时间。
5.一种确定网页打开时间的装置,其特征在于,所述装置包括:
获取模块,用于获取域名系统服务器中的日志信息,其中,所述日志信息包含至少一个用户的网络协议地址和所述至少一个用户访问第一网页时所产生的域名信息;
分析模块,用于利用MapReduce模型对所述日志信息进行分析,确定所述至少一个用户访问所述第一网页的平均打开时间;
其中,所述分析模块,具体包括:
第一确定子模块,用于基于所述日志信息,确定所述第一网页所对应的首域名段和尾域名段;
第二确定子模块,用于执行所述MapReduce模型中的Map处理过程,确定与所述首域名段对应的起始时间和与所述尾域名段对应的终止时间;
第三确定子模块,用于执行所述MapReduce模型中的Reduce处理过程,基于所述起始时间和所述终止时间,确定所述至少一个用户访问所述第一网页的平均打开时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京润通丰华科技有限公司,未经北京润通丰华科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510431503.9/1.html,转载请声明来源钻瓜专利网。





