[发明专利]确定网页流失率的方法及装置有效
申请号: | 201710950481.6 | 申请日: | 2017-10-13 |
公开(公告)号: | CN110020074B | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 陈熹荣 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/958 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李金;王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 网页 流失率 方法 装置 | ||
1.一种确定网页流失率的方法,其特征在于,所述方法包括:
获取待监测网站的至少一个监控事件中的各网页访问事件;
对所述至少一个监控事件:基于各网页访问事件和预设访问路径中各访问节点之间的访问顺序,得到该监控事件的访问路径,所述预设访问路径是为所述待监测网站设置的路径;
基于该监控事件的访问路径,得到该监控事件的第一个连续访问子路径;
基于各监控事件的第一个连续访问子路径,得到所述待监测网站中各网页的网页流失率;
其中,所述基于该监控事件的访问路径,得到该监控事件的第一个连续访问子路径包括:
在判断出该监控事件的访问路径中包括所述预设访问路径中各访问节点,且该监控事件的访问路径中所包括的预设连续访问路径中各访问节点在访问路径中的访问顺序与所述预设访问路径中各访问节点的访问顺序相同的情况下,将所述预设访问路径确定为该监控事件的第一个连续访问子路径;
在判断出该监控事件的访问路径不包括所述预设访问路径中的第i个访问节点,且该监控事件的访问路径的第一个访问节点为所述预设访问路径中的第一个访问节点的情况下,将所述访问路径中以所述第一个访问节点为开始节点的访问子路径确定为该监控事件的第一个连续访问子路径,其中i为大于1的自然数,且i小于等于N,N为预设连续访问路径中的节点总数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在判断出该监控事件的访问路径的第一个访问节点不是所述预设访问路径中的第一个访问节点的情况下,丢弃该监控事件。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:生成基于各监控事件的第一连续访问子路径的网页监控图。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:基于网页访问事件对应的用户信息,将所述网页访问事件存储在所述用户信息对应的第一事件集合中;
在当前存储的所述网页访问事件的发生时间与之前存储的其他网页访问事件的发生时间的差值在预设时间差值内的情况下,对当前存储的所述网页访问事件和之前存储的其他网页访问事件进行去重处理,得到剩余的网页访问事件;
基于剩余的网页访问事件,得到所述监控事件,并将所述监控事件存储在第二事件集合中,以对所述第二事件集合中的各监控事件执行所述获取待监测网站的至少一个监控事件中的各网页访问事件的步骤;
从所述第一事件集合中删除所述剩余的网页访问事件。
5.一种确定网页流失率的装置,其特征在于,所述装置包括:
获取单元,用于获取待监测网站的至少一个监控事件中的各网页访问事件;
路径得到单元,用于对所述至少一个监控事件:基于各网页访问事件和预设访问路径中各访问节点之间的访问顺序,得到该监控事件的访问路径,所述预设访问路径是为所述待监测网站设置的路径;
子路径得到单元,用于基于该监控事件的访问路径,得到该监控事件的第一个连续访问子路径;
流失率得到单元,用于基于各监控事件的第一个连续访问子路径,得到所述待监测网站中各网页的网页流失率;
其中,所述子路径得到单元,用于在判断出该监控事件的访问路径中包括所述预设访问路径中各访问节点,且该监控事件的访问路径中所包括的预设连续访问路径中各访问节点在访问路径中的访问顺序与所述预设访问路径中各访问节点的访问顺序相同的情况下,将所述预设访问路径确定为该监控事件的第一个连续访问子路径;
以及用于在判断出该监控事件的访问路径不包括所述预设访问路径中的第i个访问节点,且该监控事件的访问路径的第一个访问节点为所述预设访问路径中的第一个访问节点的情况下,将所述访问路径中以所述第一个访问节点为开始节点的访问子路径确定为该监控事件的第一个连续访问子路径,其中i为大于1的自然数,且i小于等于N,N为预设连续访问路径中的节点总数。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:生成单元,用于生成基于各监控事件的第一连续访问子路径的网页监控图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710950481.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种直播网页爬取方法及装置
- 下一篇:非法网站自动发掘装置