[发明专利]一种具有关联关系的用户挖掘方法、装置及电子设备在审
| 申请号: | 201810469344.5 | 申请日: | 2018-05-16 |
| 公开(公告)号: | CN108763359A | 公开(公告)日: | 2018-11-06 |
| 发明(设计)人: | 王璐;张文明;陈少杰 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 430070 湖北省武汉市武汉东湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 从属关系 关联关系 装置及电子设备 邻居关系 用户挖掘 互联网协议 迭代算法 同一设备 网上行为 用户确定 用户团体 时间段 挖掘 | ||
1.一种具有关联关系的用户挖掘方法,其特征在于,包括:
将在设定时间段内基于同一设备和/或相同互联网协议IP地址进行特定网上行为的用户确定为具有邻居关系的用户;
基于迭代算法确定所述具有邻居关系的用户中具有从属关系的用户;
根据所述具有从属关系的用户的确定结果,确定具有团体关系的所有用户。
2.根据权利要求1所述的方法,其特征在于,所述基于迭代算法确定所述具有邻居关系的用户中具有从属关系的用户,包括:
为每个用户确定用于标识对应用户的标签;
使用每个用户的标签基于迭代算法计算每个用户与其邻居用户之间的从属概率,并在每个用户与其邻居用户之间的从属概率保持不变时停止迭代;
根据每个用户与其邻居用户之间的从属概率确定具有邻居关系的用户中具有从属关系的用户。
3.根据权利要求2所述的方法,其特征在于,所述使用每个用户的标签基于迭代算法计算每个用户与其邻居用户之间的从属概率,包括:
按照如下公式计算在第k次迭代时用户x与其邻居用户c之间的从属概率pk(c,x):
其中,N(x)表示用户x的邻居用户组成的集合,|N(x)|表示用户x的邻居用户的数量,y表示用户x的邻居用户,pk-1(c,y)表示在第k-1次迭代时,用户y与用户c之间的从属概率。
4.根据权利要求3所述的方法,其特征在于,所述使用每个用户的标签基于迭代算法计算每个用户与其邻居用户之间的从属概率,还包括:
每次迭代时,若用户x与其邻居用户c之间的从属概率pk(c,x)均大于等于保留阈值,则保留当前次迭代中的从属概率pk(c,x);
若只有部分pk(c,x)大于等于保留阈值,则对用户x与其邻居用户c之间的从属概率pk(c,x)进行归一化处理;
若所有的pk(c,x)都小于保留阈值,则从N(x)中随机挑选用户c0且设置用户x与其邻居用户c0之间的从属概率pk(c0,x)为1,并将pk(c0,x)作为用户x的当前次迭代结果。
5.根据权利要求4所述的方法,其特征在于,在第k次迭代中,使用如下归一化公式对用户x与其邻居用户c之间的从属概率进行归一化处理:
其中,pk′(c,x)表示在第k次迭代中归一化之后用户x与其邻居用户c之间的从属概率,N(x)表示用户x的邻居用户组成的集合,pk(c,x)表示在第k次迭代时归一化之前用户x与其邻居用户c之间的从属概率,I(pk(c,x)≥1/v)是示性函数,若pk(c,x)≥1/v,则I(pk(c,x)≥1/v)取1,否则取0,1/v表示保留阈值。
6.根据权利要求2-5中任一项所述的方法,其特征在于,所述根据所述具有从属关系的用户的确定结果,确定具有团体关系的所有用户,包括:
将与相同用户具有从属关系的用户确定为具有团体关系的用户。
7.根据权利要求1-5中任一项所述的方法,其特征在于,所述特定网上行为,包括:通过直播平台针对相同的主播进行刷弹幕行为和/或通过直播平台针对相同的主播进行刷关注行为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810469344.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据校验方法及装置
- 下一篇:一种分类方法及装置、计算机可读存储介质





