[发明专利]一种识别目标网络团体的方法及系统、存储介质、设备有效
申请号: | 202010539840.0 | 申请日: | 2020-06-12 |
公开(公告)号: | CN113810341B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 王璐 | 申请(专利权)人: | 武汉斗鱼鱼乐网络科技有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L65/40;G06F16/9536 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 孙朝锐 |
地址: | 430000 湖北省武汉市东湖新技术开发区软件园东路*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 目标 网络 团体 方法 系统 存储 介质 设备 | ||
本发明公开了一种识别目标网络团体的方法,从参与所述网络直播平台的用户集中识别出在预设时间段内使用同一设备或同一IP的用户数量大于第一阈值的第一目标网络团体集,获得第二用户集;分别对所述第一目标网络团体集和所述第二用户集中每个用户提取相同的N种特征对应的N个特征值,获得第一特征向量和第二特征向量;基于所述N种特征和M个所述第二特征向量,构建二叉树;基于所述二叉树,获得第一目标参量和第二目标参量;基于所述第二用户集中用户的第一目标参量和第二目标参量,从所述第二用户集中识别出第二目标网络团体。
技术领域
本发明涉及网络直播技术领域,尤其涉及一种识别目标网络团体的方法及系统、存储介质、设备。
背景技术
在网络直播平台上,经常会遭到一些目标网络团体的恶意网络攻击,造成直播网络堵塞的问题。现有技术中,通过一些聚类算法来识别这些目标网络团体,但是由于目标网络团体可以分批进行网络攻击,规模小,表现出来的聚集性低。因此,现有的目标网络团伙挖掘算法识别目标网络团体准确率低,仍然不能解决直播网络堵塞的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的识别目标网络团体的方法及系统、存储介质、设备。
一方面,本申请通过本申请的一实施例提供如下技术方案:
一种识别目标网络团体的方法,用于网络直播平台,所述方法包括:
获取参与所述网络直播平台的用户,获得第一用户集;
从所述第一用户集中识别出在预设时间段内使用同一设备或同一IP的用户数量大于第一阈值的第一目标网络团体,获得第一目标网络团体集;
基于所述第一目标网络团体集和所述第一用户集,获得第二用户集;其中,所述第二用户集包括所述第一用户集中除所述第一目标网络团体集外的所有用户;
分别对所述第一目标网络团体集和所述第二用户集中每个用户提取相同的N种特征对应的N个特征值,获得L个包含所述第一目标网络团体集中用户的N个特征值的第一特征向量和M个包含所述第二用户集中用户的N个特征值的第二特征向量,其中,L为所述第一目标网络团体集中用户数,M为所述第二用户集中用户数,L和M为正整数;
基于所述N种特征和M个所述第二特征向量,构建二叉树;
基于所述二叉树,获得表征所述第二用户集中用户异常程度的第一目标参量;
基于L个所述第一特征向量和M个所述第二特征向量,获得表征所述第二用户集中用户与所述第一目标网络团体集之间相似度的第二目标参量;
基于所述第二用户集中用户的第一目标参量和第二目标参量,从所述第二用户集中识别出第二目标网络团体。
可选的,在所述基于所述第一目标参量和所述第二目标参量,从所述第二用户集中识别出第二目标网络团体之后,所述方法还包括:
对所述第一目标网络团体集中的用户和所述第二目标网络团体中的用户进行屏蔽。
可选的,所述N种特征包括用户在预设时间段内发生目标行为的次数、用户在预设时间段内使用的IP数和用户在预设时间段内使用的设备数。
可选的,所述基于所述N种特征和M个所述第二特征向量,构建二叉树,具体包括:
S101、将所述N种特征中的任意一种特征作为二叉树结构的起始节点;
S102、在该特征对应的最大特征值和最小特征值之间,利用重要性采样方法随机采样获得目标特征值;
S103、将小于所述目标特征值的特征值划到所述二叉树结构的左分支,大于等于所述目标特征值的特征值划到右分支;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼鱼乐网络科技有限公司,未经武汉斗鱼鱼乐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010539840.0/2.html,转载请声明来源钻瓜专利网。