[发明专利]一种确定访问页面的终端数量的方法及装置有效
申请号: | 201310001451.2 | 申请日: | 2013-01-04 |
公开(公告)号: | CN103095820A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 刘洋 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 访问 页面 终端 数量 方法 装置 | ||
技术领域
本发明涉及互联网技术领域和计算机技术领域,尤其涉及一种确定访问页面的终端数量的方法及装置。
背景技术
在目前的互联网应用中,为了有针对性的对网站进行管理,经常需要统计网站被用户访问时,访问网站的用户量,也即访问网站的终端数量,也可以统计访问网站页面的终端数量。
现有技术中,当终端访问某一网站的页面时,网站服务器会记录访问日志,日志中可以包括该终端的标识,如IP地址,COOKIE,该终端使用的操作系统,该终端上安装的浏览器的版本,访问时间,以及该终端浏览的上一个页面的域名等信息,终端浏览的上一个页面也可以称作是页面本次被访问时的来源页面。
在记录的访问日志所包括的信息中,IP和COOKIE属于能够辨别终端身份的主要信息,具有唯一性。鉴于其唯一性,IP或COOKIE作为终端标识信息,可以用来统计访问网站的终端数量,即基于每条访问日志中记录的终端标识信息,可以统计一段时间内访问一个网站的终端数量,也可以统计一段时间内访问一个或多个页面的终端的数量。
然而,在用户通过终端访问网站时,经常会在短时间内多次访问一个页面或同一网站的多个页面,此时在统计访问网站的终端数量时,如果仅仅是根据访问日志中的终端标识信息进行简单叠加进行统计,显然是不准确的,而是需要对访问日志中的终端标识信息进行比对,以及对相同的终端标识信息进行排重,才能够得到准确的统计结果。
然而,对于一些访问量很大的网站,例如,每天数十亿次的页面访问,在基于对终端标识信息的比对和排重处理,对访问网站的终端数量进行统计时,需要消耗大量的处理资源,且由于数据量较大仍然需要很长的时间才能得到统计结果,实际中,往往需要数组服务器共同运算数十小时才能得到结果。
发明内容
本发明实施例提供一种确定访问页面的终端数量的方法及装置,用以解决现有技术中存在的确定访问页面的终端数量所消耗的处理资源较多,效率较低的问题。
本发明实施例提供一种确定访问页面的终端数量的方法,包括:
获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;
确定所述终端数量与所述次数的比值;
基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。
本发明实施例还提供一种确定访问页面的终端数量的装置,包括:
获取单元,用于获取历史时间段内访问页面集合中的页面的终端数量,以及所述历史时间段内所述页面集合中的页面被访问的次数;
第一确定单元,用于确定所述终端数量与所述次数的比值;
第二确定单元,用于基于所述比值,根据统计的评估时间段内所述页面集合中的页面被访问的次数,确定所述评估时间段内访问所述页面集合中的页面的终端数量。
本发明有益效果包括:
本发明实施例提供的方法中,在确定访问页面的终端数量时,首先获取历史时间段内访问页面集合中的页面的终端数量,以及该历史时间段内该页面集合中的页面被访问的次数,然后确定获取的该终端数量与该次数的比值,并基于确定的该比值,根据统计的评估时间段内该页面集合中的页面被访问的次数,确定该评估时间段内访问该页面集合中的页面的终端数量。本发明实施例提供的方案中,不再需要对访问日志中记录的终端标识信息进行比对和排重处理,只需要统计页面被访问的次数,并基于通过历史统计结果得到的访问页面的终端数量与页面被访问的次数的比值,即可以确定评估时间段内访问页面的终端数量,从而减少了处理资源的消耗,并且提高了处理效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的确定访问页面的终端数量的方法的流程图;
图2为本发明实施例1提供的确定访问页面的终端数量的方法的流程图;
图3为本发明实施例2提供的确定访问页面的终端数量的方法的流程图;
图4为本发明实施例3提供的确定访问页面的终端数量的装置的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310001451.2/2.html,转载请声明来源钻瓜专利网。