[发明专利]基于过滤会话实现提取页面信息的方法及装置有效
申请号: | 201710890000.7 | 申请日: | 2017-09-27 |
公开(公告)号: | CN109948034B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 文锃 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/957 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 过滤 会话 实现 提取 页面 信息 方法 装置 | ||
1.一种基于过滤会话实现提取页面信息的方法,其特征在于,所述方法包括:
根据预置时间周期采集用户访问网站所产生的访问数据,所述访问数据中包含用户访问网站所建立的多个会话,所述会话中包含一序列按照用户浏览网页顺序排列的页面;
根据预置会话属性将所述访问数据中的会话所包含的会话属性信息存储在会话信息表中,预置会话属性是指根据分析用户访问行为的需求而预先设置的会话属性;
根据预置页面属性将所述访问数据中页面所包含的页面属性信息存储在页面信息表中,所述预置页面属性是指根据分析用户访问行为的需求而预先设置的页面属性,所述预置页面属性至少包含页面在访问路径中的访问顺序信息;
当接收到向会话信息表发起的查询请求时,解析所述查询请求中包含的查询条件,其中,所述会话信息表中包含多个用于存储会话属性信息的属性列以及一个用于存储会话身份标识ID的标识信息列,所述会话是用户在浏览网站时与网站所建立的一次对话,在一次会话中由于用户浏览网页行为发生多个页面跳转事件,一次会话对应一条访问路径,一条访问路径包含一序列根据用户浏览网页顺序排列的多个页面;
根据所述查询条件,从所述会话信息表中获取与所述查询条件匹配的会话信息,所述会话信息中包含会话属性信息以及会话ID;
根据所述会话信息中包含的会话ID,从页面信息表中提取与所述会话ID匹配的会话所包含的多个页面的页面信息,其中,所述页面信息表中包含多个用于存储页面信息的属性列以及一个用于存储会话ID的标识信息列。
2.根据权利要求1所述的方法,其特征在于,所述根据所述会话信息中包含的会话ID,从页面信息表中提取与所述会话ID匹配的会话所包含的多个页面的页面信息包括:
从会话信息中获取会话ID;
利用所述会话ID查找页面信息表中标识信息列;
判断所述标识信息列中是否存在所述会话ID;
若存在,则提取所述会话ID对应的会话所包含的页面信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述查询条件,从所述会话信息表中获取与所述查询条件匹配的会话信息包括:
解析所述查询条件中包含的会话属性信息;
确定所述会话属性信息在会话信息表中所对应的属性列;
从所述属性列中提取与所述查询条件中包含的会话属性信息相匹配的会话属性信息;
确定所述会话属性信息所归属的会话所对应的会话ID;
从所述会话信息表中提取所述会话ID对应的会话所包含的会话信息;
将所述会话信息存储在中间结果表里。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述当接收到向会话信息表发起的查询请求时,解析所述查询请求中包含的查询条件包括:
当接收到向会话信息表发起的查询请求时,解析所述查询请求中包含的关键字信息;
判断所述会话信息表的属性列中是否存在与所述关键字信息对应的会话属性;
若存在,则根据所述会话属性确定所述查询请求中包含的查询条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710890000.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种垂直领域源数据过滤方法及装置
- 下一篇:一种分词词项权重的计算方法和装置