[发明专利]虚假流量的识别方法和装置有效
| 申请号: | 201910189827.4 | 申请日: | 2019-03-13 |
| 公开(公告)号: | CN109831454B | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 杨同洲 | 申请(专利权)人: | 北京深演智能科技股份有限公司 |
| 主分类号: | H04L9/40 | 分类号: | H04L9/40 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡 |
| 地址: | 100020 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 虚假 流量 识别 方法 装置 | ||
本发明公开了一种虚假流量的识别方法和装置。其中,该方法包括:获取流量的特征信息,其中,特征信息至少包括:时间特征信息、设备特征信息和行为特征信息;根据流量的特征信息对流量进行聚合;根据流量的聚合结果确定流量中的虚假流量。本发明解决了现有技术中虚假流量较逼真,导致难以识别的技术问题。
技术领域
本发明涉及数据的护理领域,具体而言,涉及一种虚假流量的识别方法和装置。
背景技术
广告投放中有很多的团伙作弊流量,作弊流量通常来自于以下作弊行为:机器行为,例如IP重复刷量、更换不同IP重复刷量、流量劫持等;挂战软件,例如,使用浏览器内核,多人安装互刷软件,每天制造多次虚假PV,从而伪造大量流量。这些虚假的流量会降低广告投放的效果。
目前识别虚假流量的方式是,使用手机唯一标识符deviceID或者IP来作为一个key,即一个“人”,通过这个key的点击广告的频次等参数来判断这个key是否是虚假的流量。
但随着技术的升级,作弊团伙为了使虚假流量更逼真,经常不停的变换流量里的deviceID和IP,通过单个的deviceID或者IP作为key来分析作弊流量就会太宽泛,难以准确的识别出虚假流量。
针对现有技术中虚假流量较逼真,导致难以识别的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种虚假流量的识别方法和装置,以至少解决现有技术中虚假流量较逼真,导致难以识别的技术问题。
根据本发明实施例的一个方面,提供了一种虚假流量的识别方法,包括:获取流量的特征信息,其中,特征信息至少包括:时间特征信息、设备特征信息和行为特征信息;根据流量的特征信息对流量进行聚合;根据流量的聚合结果确定流量中的虚假流量。
进一步地,根据流量的特征信息,将流量映射在三维空间中,得到流量在三维空间中对应点;根据点在三维空间中的位置对流量所对应的点进行聚合,得到流量的聚合结果。
进一步地,确定每个点与最近的其他点之间的距离;如果距离小于预设值,则将点与其他点聚合为一个簇。
进一步地,获取包围簇的最小球体的体积;获取簇中点的数量;根据数量和体积获取最小球体的密度;根据最小球体的密度确定簇中的点所表示的流量是否为虚假流量。
进一步地,最小球体的密度小于预设值,簇中的点所表示的流量不为虚假流量;或最小球体的密度大于或等于预设值,簇中的点所表示的流量为虚假流量。
进一步地,获取流量对应的流量数据;基于流量的流量数据确定流量的多组特征数据,其中,多组特征数据至少包括:时间特征数据、设备特征数据和行为特征数据;对每一组特征数据进行归一化处理;根据归一化处理的结果,对每一组特征数据进行降维,得到多个一维的特征信息。
进一步地,多组特征数据包括:第一组特征数据、第二组特征数据和第三组特征数据,其中,第一组特征数据包括:单位时间内上网的起始时间,流量曝光时间间隔的标准差和流量曝光次数最多的时间点;第二组特征数据包括:流量中使用2G网络的次数占总次数的比例、流量中使用3G网络的次数占总次数的比例、流量中使用4G网络的次数占总次数的比例、流量中使用无线网络的次数占总次数的比例、设备型号变化次数、以及设备操作系统的变化次数;第三组特征数据包括:在预设平台曝光的流量的占比和通过预设应用程序曝光的流量的占比。
进一步地,对第一组特征数据进行降维,得到时间特征信息;对第二组特征数据进行降维,得到设备特征信息;对第三组特征数据进行降维,得到行为特征信息。
根据本发明实施例的一个方面,提供了一种虚假流量的识别装置,包括:获取模块,用于获取流量的特征信息,其中,特征信息至少包括:时间特征信息、设备特征信息和行为特征信息;聚合模块,用于根流量的特征信息对流量进行聚合;确定模块用于根据流量的聚合结果确定流量中的虚假流量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京深演智能科技股份有限公司,未经北京深演智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910189827.4/2.html,转载请声明来源钻瓜专利网。





