[发明专利]基于过滤会话实现提取页面信息的方法及装置有效
申请号: | 201710890000.7 | 申请日: | 2017-09-27 |
公开(公告)号: | CN109948034B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 文锃 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/957 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 过滤 会话 实现 提取 页面 信息 方法 装置 | ||
本发明公开了一种基于过滤会话实现提取页面信息的方法及装置,涉及互联网技术领域,提高分析用户访问行为的工作效率,本发明的主要技术方案为:当接收到向会话信息表发起的查询请求时,解析查询请求中包含的查询条件,其中,会话信息表中包含多个用于存储会话属性信息的属性列以及一个用于存储会话身份标识ID的标识信息列;根据查询条件,从会话信息表中获取与查询条件匹配的会话信息,会话信息中包含会话属性信息以及会话ID;根据会话信息中包含的会话ID,从页面信息表中提取与会话ID匹配的会话所包含的多个页面的页面信息,其中,页面信息表中包含多个用于存储页面属性信息的属性列以及一个用于存储会话ID的标识信息列。
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于过滤会话实现提取页面信息的方法及装置。
背景技术
随着互联网技术的迅速发展,人们的日常生活越来越离不开网络,比如访问网站实现购物、理财、阅读等等网络消费行为,其都将使得日常生活中的琐事变得更加简单、便捷。有鉴于此,网站通常会利用采集到的用户访问路径数据分析用户在浏览网站时所发生的用户访问行为,以便于网站可以根据分析结果对网站的内容以及布局等做出更好的规划。
目前,一般采用网站分析系统的路径导航功能对采集到的访问路径数据进行聚合,并将聚合结果呈现在路径导航界面上,以便网站工作人员根据路径导航界面所显示的信息分析用户访问行为。对于路径导航界面所能呈现的聚合结果进行分析,当在路径导航界面上查询一个网页时,该路径导航界面上显示的信息包括:该网页的页面浏览量、该网页的前置页面(在访问路径中当以某个网页为根节点时,该根节点的前置节点所指示的页面是前置页面)的网址以及前置页面的页面浏览量、该网页的后置页面(在访问路径中当以某个网页为根节点时,该根节点的后置节点所指示的页面是后置页面)的网址以及后置页面的页面浏览量。例如,采集最近10天网站被访问所产生的访问路径数据并利用路径导航功能对访问路径数据进行聚合处理,当在路径导航界面查询网页A时,该路径导航界面显示的信息包括:网页A的页面浏览量1000次、网页A的前置页面B以及B的页面浏览量300次、网页A的前置页面C以及C的页面浏览量700次、网页A的后置页面D以及D的页面浏览量200次,据此,路径导航界面所显示的以上信息表明:存在访问序列B-A-D和C-A-D,并且网页A被访问1000次,其中300次是由页面B跳转至网页A,700次是由页面C跳转至网页A,此外,页面D被访问的200次是由网页A跳转至页面D的。根据路径导航界面显示的信息,网站工作人员可以对网站中发生的用户访问行为进行分析。
然而,路径导航界面所显示的信息仅是在访问序列中网页的页面浏览量、网页前置或后置页面的页面浏览量的数据信息,当网站工作人员根据这些数据信息锁定待分析的数据范围时,仍然需要在待分析的数据范围中浏览每个网页并分析网页的相关内容信息,比如网页的主题信息、网页的IP地址、打开网页的浏览器名称及版本信息等等,在待分析的数据范围内提取出与分析用户访问行为相关的数据,而后再根据提取出的相关数据来分析用户的访问行为,由于待分析的数据范围所包含的数据量仍然是很大的,并且需要人工浏览数据范围内的每个网页而筛选出与分析用户访问行为相关的数据,所以网站工作人员在分析用户访问行为的过程中需要消耗很大的人工工作量,进而导致分析网站中用户访问行为的效率是比较低的。
发明内容
有鉴于此,本发明提供一种基于过滤会话实现提取页面信息的方法及装置,主要目的在于优化提取用于分析用户访问行为所需数据的过程,减少待分析的访问路径数据量,提高分析用户访问行为的工作效率。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明提供了一种基于过滤会话实现提取页面信息的方法,该方法包括:
当接收到向会话信息表发起的查询请求时,解析所述查询请求中包含的查询条件,其中,所述会话信息表中包含多个用于存储会话属性信息的属性列以及一个用于存储会话身份标识ID的标识信息列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710890000.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种垂直领域源数据过滤方法及装置
- 下一篇:一种分词词项权重的计算方法和装置