[发明专利]网站用户行为分析方法及装置有效
| 申请号: | 201811296910.3 | 申请日: | 2018-11-01 |
| 公开(公告)号: | CN111124847B | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 黄斐乔;李中艺;叶峻;高春旭 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G06F11/34 | 分类号: | G06F11/34;H04L41/14;H04L67/02 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网站 用户 行为 分析 方法 装置 | ||
本发明提出一种网站用户行为分析方法及装置,其中方法包括:获取网站对应的点击日志,点击日志中的每条点击记录包括:网页标识、网页内被点击的元素标识、点击在元素内的偏移坐标、元素的尺寸信息;针对每条点击记录,结合预设的离散化函数以及元素的尺寸信息,对偏移坐标进行离散化,得到离散后的偏移坐标,生成离散后点击记录,以将一定范围内的偏移坐标聚合到同一个离散后的偏移坐标;针对每个离散后点击记录,获取与离散后点击记录对应的点击记录的数量,将数量确定为离散后点击记录对应的点击数,进而对网站用户行为进行分析,从而能够减少所需要分析的点击记录数量,在确保网站用户行为分析准确度的情况下,提高对网站用户行为的分析效率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种网站用户行为分析方法及装置。
背景技术
目前的网站用户行为分析方法主要包括:获取网站对应的点击日志,点击日志中包括多条点击记录,每条点击记录中包括:网页标识+元素标识+点击在网页元素内的偏移量所占的百分比,例如X轴百分比和Y轴百分比;根据该点击日志分析网站用户行为。然而,上述方案中,为了确保采集到的点击日志的准确度,例如,点击位置精确到元素的百分之一,则需要将网页中的每个元素分为一万个点,这种分法导致采集到的点击记录数据量过大,对点击日志的分析时间过长,从而导致网站用户行为的分析效率很差。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种网站用户行为分析方法,用于解决现有技术中点击记录数据量过大,导致网站用户行为分析效率差的问题。
本发明的第二个目的在于提出一种网站用户行为分析装置。
本发明的第三个目的在于提出另一种网站用户行为分析装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种网站用户行为分析方法,包括:
获取网站对应的点击日志,所述点击日志中包括:用户对所述网站中各网页的点击记录;每条点击记录中包括:网页标识、网页内被点击的元素标识、点击在元素内的偏移坐标、元素的尺寸信息;
针对每条点击记录,结合预设的离散化函数以及元素的尺寸信息,对所述偏移坐标进行离散化,得到离散后的偏移坐标,生成离散后点击记录,以将一定范围内的偏移坐标聚合到同一个离散后的偏移坐标;
针对每个离散后点击记录,获取与所述离散后点击记录对应的点击记录的数量,将所述数量确定为离散后点击记录对应的点击数;
根据每个离散后点击记录以及对应的点击数,对网站用户行为进行分析。
进一步的,所述偏移坐标包括:X轴偏移坐标和Y轴偏移坐标;所述尺寸信息包括:宽度信息和高度信息;
所述针对每条点击记录,结合预设的离散化函数以及元素的尺寸信息,对所述偏移坐标进行离散化,得到离散后的偏移坐标,生成离散后点击记录,包括:
针对每条点击记录,结合预设的离散化函数以及元素的宽度信息,对所述X轴偏移坐标进行离散化,得到离散后的X轴偏移坐标,以将第一预设范围内的X轴偏移坐标聚合到同一个离散后的X轴偏移坐标;
结合预设的离散化函数以及元素的高度信息,对所述Y轴偏移坐标进行离散化,得到离散后的Y轴偏移坐标,以将第二预设范围内的Y轴偏移坐标聚合到同一个离散后的Y轴偏移坐标;
根据所述离散后的X轴偏移坐标、所述离散后的Y轴偏移坐标、所述点击记录中的网页标识以及元素标识,生成离散后点击记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811296910.3/2.html,转载请声明来源钻瓜专利网。





