[发明专利]点击热力图异常检测方法及装置有效
申请号: | 201710915326.0 | 申请日: | 2017-09-30 |
公开(公告)号: | CN110020354B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 刘振华 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/951;G06F16/953;G06F16/9535 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张建;王宝筠 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 点击 力图 异常 检测 方法 装置 | ||
本发明公开了一种点击热力图异常检测方法及装置,可以获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域。本发明根据各区域中各点击来源对应的点击行为发生在该区域中的点击概率确定异常点击区域,无需通过人工识别,准确性和识别效率较高。
技术领域
本发明涉及流量作弊检测领域,尤其涉及点击热力图异常检测方法及装置。
背景技术
随着互联网的发展,用户更多的通过电子设备浏览各种网站的网页或应用程序的界面。通过购买广告可以为广告购买方带来更多的互联网流量,从而使得更多的用户浏览和点击广告购买方网站的网页或应用程序的界面。但流量作弊行为长期损害着广告购买方的正当权益,例如一些刷流量的软件会自动且大量的访问广告购买方的网站并进行大量点击操作,这些点击操作没有为广告购买方带来收益,但广告购买方却需要为之付费。
由于点击热力图可以很好的体现网站的网页或应用程序的界面中的点击情况,因此可以根据点击热力图确定异常点击行为从而识别异常流量。现有技术通过人工对点击热力图中的异常点击行为进行识别,准确性和识别效率较低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的点击热力图异常检测方法及装置,方案如下:
一种点击热力图异常检测方法,包括:
获得第一点击热力图,将所述第一点击热力图分割为多个区域;
对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;
对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。
可选的,所述将所述第一点击热力图分割为多个区域,包括:
将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。
可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
对每一个点击来源P:
确定该点击来源P相对于其他点击来源的第一相对熵D1,
其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率,为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;
在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;
在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。
可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:
确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710915326.0/2.html,转载请声明来源钻瓜专利网。