[发明专利]数据处理方法、装置、存储介质及设备有效
申请号: | 202010037386.9 | 申请日: | 2020-01-14 |
公开(公告)号: | CN111259242B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 张李均焕 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 存储 介质 设备 | ||
本申请实施例公开了一种数据处理方法、装置、存储介质及设备,其中,该方法包括:获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容,根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度,根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台,从属于该目标内容展示平台的访问用户中确定异常访问用户。通过本发明实施例能够提高对异常访问用户的识别准确度。
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据处理方法、装置、存储介质及设备。
背景技术
随着互联网技术的发展,越来越多的商家选择通过内容展示平台来推广商品或服务,内容展示平台是指用于展示业务内容的平台,业务内容可以包括商家需要推广的商品对应的商品信息(如名称、类型),或者需要推广的服务对应的服务信息(如服务内容)。实践中发现,存在内容展示平台通过制造大量异常用户(如虚假用户),来访问内容展示平台所展示的业务内容,以达到增加内容展示平台的访问量的目的。目前,主要通过对每个访问用户的访问行为进行分析,以识别出异常访问用户,但是存在异常访问用户模仿正常访问用户的访问行为的情况,导致将异常访问用户误识别为正常访问用户,降低对异常访问用户的识别准确度。
发明内容
本申请实施例所要解决的技术问题在于,提供一种数据处理方法、装置、存储介质及设备,能够提高对异常访问用户的识别准确度。
本申请实施例一方面提供一种数据处理方法,包括:
获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容;
根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度;
根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台;
从属于该目标内容展示平台的访问用户中确定异常访问用户。
本申请实施例一方面提供一种数据处理装置,包括:
获取模块,用于获取与至少两个内容展示平台相关联的访问用户,该至少两个内容展示平台用于向该访问用户提供业务内容;
生成模块,用于根据该访问用户生成该至少两个内容展示平台之间的访问用户重叠度;
筛选模块,用于根据该访问用户重叠度在该至少两个内容展示平台中筛选被异常访问的内容展示平台,作为目标内容展示平台;
确定模块,用于从属于该目标内容展示平台的访问用户中确定异常访问用户。
上述筛选模块,包括:
连接单元,用于将该至少两个内容展示平台确定为至少两个节点,将该至少两个节点中访问用户重叠度大于第一重叠阈值的两个节点进行连接,得到包含该至少两个节点的平台网络图;
第一确定单元,用于若该平台网络图中包括完全子图,且该完全子图中的节点的数量大于第一数量阈值,则将该完全子图中访问用户重叠度大于第二重叠阈值的两个节点,作为该目标内容展示平台。
上述筛选模块,包括:
第二确定单元,用于从该至少两个内容展示平台中确定与第一内容展示平台的访问用户重叠度大于第三重叠阈值的内容展示平台,作为第二内容展示平台,该第一内容展示平台属于该至少两个内容展示平台;
第一获取单元,用于获取该第二内容展示平台的数量;
第二确定单元,还用于若该第二内容展示平台的数量大于第二数量阈值,则将该第一内容展示平台作为该目标内容展示平台。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010037386.9/2.html,转载请声明来源钻瓜专利网。