[发明专利]一种识别目标网络团体的方法及系统、存储介质、设备有效
申请号: | 202010539840.0 | 申请日: | 2020-06-12 |
公开(公告)号: | CN113810341B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 王璐 | 申请(专利权)人: | 武汉斗鱼鱼乐网络科技有限公司 |
主分类号: | H04L9/40 | 分类号: | H04L9/40;H04L65/40;G06F16/9536 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 孙朝锐 |
地址: | 430000 湖北省武汉市东湖新技术开发区软件园东路*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 目标 网络 团体 方法 系统 存储 介质 设备 | ||
1.一种识别目标网络团体的方法,用于网络直播平台,其特征在于,所述方法包括:
获取参与所述网络直播平台的用户,获得第一用户集;
从所述第一用户集中识别出在预设时间段内使用同一设备或同一IP的用户数量大于第一阈值的第一目标网络团体,获得第一目标网络团体集;
基于所述第一目标网络团体集和所述第一用户集,获得第二用户集;其中,所述第二用户集包括所述第一用户集中除所述第一目标网络团体集外的所有用户;
分别对所述第一目标网络团体集和所述第二用户集中每个用户提取相同的N种特征对应的N个特征值,获得L个包含所述第一目标网络团体集中用户的N个特征值的第一特征向量和M个包含所述第二用户集中用户的N个特征值的第二特征向量,其中,L为所述第一目标网络团体集中用户数,M为所述第二用户集中用户数,L和M为正整数;
基于所述N种特征和M个所述第二特征向量,构建二叉树;
基于所述二叉树,获得表征所述第二用户集中用户异常程度的第一目标参量;
基于L个所述第一特征向量和M个所述第二特征向量,获得表征所述第二用户集中用户与所述第一目标网络团体集之间相似度的第二目标参量;
基于所述第二用户集中用户的第一目标参量和第二目标参量,从所述第二用户集中识别出第二目标网络团体;
所述基于所述N种特征和M个所述第二特征向量,构建二叉树,具体包括:
S101、将所述N种特征中的任意一种特征作为二叉树结构的起始节点;
S102、在该特征对应的最大特征值和最小特征值之间,利用重要性采样方法随机采样获得目标特征值;
S103、将小于所述目标特征值的特征值划到所述二叉树结构的左分支,大于等于所述目标特征值的特征值划到右分支;
S104、基于所述左分支的特征值和右分支的特征值,以所述左分支和/或右分支作为起始节点,重复S101~S103,循环直到左分支和右分支中只包含一个特征值或全部特征值相同,获得二叉树。
2.如权利要求1所述的方法,其特征在于,在所述基于所述第一目标参量和所述第二目标参量,从所述第二用户集中识别出第二目标网络团体之后,所述方法还包括:
对所述第一目标网络团体集中的用户和所述第二目标网络团体中的用户进行屏蔽。
3.如权利要求1所述的方法,其特征在于,所述N种特征包括用户在预设时间段内发生目标行为的次数、用户在预设时间段内使用的IP数和用户在预设时间段内使用的设备数。
4.如权利要求3所述的方法,其特征在于,所述基于所述二叉树集合,获得表征所述第二用户集中用户异常程度的第一目标参量,具体包括:
按照如下公式获得所述第一目标参量:
其中:
IS(x)表示第二特征向量为x的用户的第一目标参量;
ht(x)表示用户的第二特征向量x在所述二叉树中的路径长度,t为多次执行S101~S104获得的n个二叉树中的第t个二叉树。
5.如权利要求4所述的方法,其特征在于,所述基于L个所述第一特征向量和M个所述第二特征向量,获得表征所述第二用户集中用户与所述第一目标网络团体集之间相似度的第二目标参量,具体包括:
按照如下公式获得所述第二目标参量:
其中,SS(x)是第二特征向量为x的用户的第二目标参量;g(u)表示第一目标网络团体g的中心向量,xm表示的是g中用户m的第一特征向量,G表示第一目标网络团体集;|g|表示g的用户数;||.||2表示向量的2范数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼鱼乐网络科技有限公司,未经武汉斗鱼鱼乐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010539840.0/1.html,转载请声明来源钻瓜专利网。