[发明专利]渠道中的用户检测方法和装置有效
申请号: | 201610044510.8 | 申请日: | 2016-01-22 |
公开(公告)号: | CN106998336B | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 孔蓓蓓;熊健;杨剑鸣 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 邢雪红;乔彬 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 渠道 中的 用户 检测 方法 装置 | ||
本发明提供了一种渠道中的用户检测方法,包括:获取渠道分发的应用中用户触发进行访问所上报的多种属性,该应用是渠道分发的任意应用,所述用户是应用所新增的用户,多种属性是用在应用中多个方面的属性;所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类,所述用户归属于得到的用户类;根据各用户类中用户的行为属性去除绝对真实用户归属的用户类;对所余下用户类中的用户进行模糊判别,以从中判别得到可疑虚假用户。此外,还提供了一种渠道中的用户检测装置。上述渠道中的用户检测方装置法和装置能够准确识别渠道下刷量工具的使用,并且准确识别渠道中掺杂的部分虚假用户。
技术领域
本发明涉及互联网应用技术领域,特别涉及一种渠道中的用户检测方法和装置。
背景技术
渠道中刷量工具的使用时有发生,以通过刷量工具生成应用的虚假用户,以造成该应用由此渠道得到大量用户的虚假现象。
现有的刷量工具可以利用模拟器随意伪造机器参数,也可以通过编写程序脚本来模拟真实用户行为,修改真机参数,驱动趁机运行,这些行为已经与真实的用户行为没有差别。
针对此情况,现有的解决方案是对渠道效果进行评估,用以实现评估的数据可以是留存率、终端分布情况、IP地址聚集情况等。例如,真实用户的留存曲线是一条平滑的指数衰减曲线,如若某一应用的留存曲线存在陡升或者陡降的异常波动,则可判定当前渠道下使用了刷量工具。同理,如果当前渠道下终端分布与大盘的终端分布不一致,则也可判定当前渠道下使用了刷量工具。
但是,随着刷量工具的迭代更新,其也会基于各种数据的整体特点来进行真实用户行为的模拟,依赖于某些数据的整体表现的现有的解决方案将无法准确地识别渠道下是否使用刷量工具,更无法对掺杂了部分虚假用户的渠道进行识别。
发明内容
基于此,有必要提供一种渠道中的用户检测方法,所述方法能够准确识别渠道下刷量工具的使用,并且准确识别渠道中掺杂的部分虚假用户。
此外,还有必要提供一种渠道中的用户检测装置,所述装置能够准确识别渠道下刷量工具的使用,并且准确识别渠道中掺杂的部分虚假用户。
为解决上述技术问题,将采用如下技术方案:
一种渠道中的用户检测方法,包括:
获取渠道分发的应用中用户触发进行访问所上报的多种属性,所述应用是所述渠道分发的任意应用,所述用户是所述应用所新增的用户,所述多种属性是所述用户在应用中多个方面的属性;
所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类,所述用户归属于得到的所述用户类;
根据各用户类中用户的行为属性去除绝对真实用户归属的用户类;
对所余下用户类中的用户进行模糊判别,以从中判别得到可疑虚假用户。
一种渠道中的用户检测装置,包括:
属性获取模块,用于获取渠道分发的应用中用户触发进行访问所上报的多种属性,所述应用是所述渠道分发的任意应用,所述用户是所述应用所新增的用户,所述多种属性是所述用户在应用中多个方面的属性;
层次聚类模块,用于所述用户之间根据所述多种属性进行层次聚类得到预设数目的用户类,所述用户归属于得到的所述用户类;
真实用户去除模块,用于根据各用户类中用户的行为属性去除绝对真实用户归属的用户类;
模糊判别模块,用于对所余下用户类中的用户进行模糊判别,以从中判别得到可疑虚假用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610044510.8/2.html,转载请声明来源钻瓜专利网。