[发明专利]机器弹幕用户识别方法、存储介质、电子设备及系统有效
| 申请号: | 201810311309.0 | 申请日: | 2018-04-09 |
| 公开(公告)号: | CN110366045B | 公开(公告)日: | 2021-07-23 |
| 发明(设计)人: | 王璐;陈少杰;张文明 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
| 主分类号: | H04N21/4788 | 分类号: | H04N21/4788;H04N21/435 |
| 代理公司: | 武汉智权专利代理事务所(特殊普通合伙) 42225 | 代理人: | 张凯 |
| 地址: | 430000 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 机器 弹幕 用户 识别 方法 存储 介质 电子设备 系统 | ||
本发明公开了一种机器弹幕用户识别方法、存储介质、电子设备及系统,涉及大数据风控领域,该方法包括基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;对弹幕发送用户间的相似性进行度量;对用户的刷弹幕可疑程度进行计算;对用户是否为机器弹幕用户进行判断。本发明通过行为聚集性找到那些潜在的风险用户,判断方式简单且准确性高,有效避免误判情况的产生。
技术领域
本发明涉及大数据风控领域,具体涉及一种机器弹幕用户识别方法、存储介质、电子设备及系统。
背景技术
在直播平台上,往往存在使用机器手段刷弹幕的舞弊行为,这种虚假的发弹幕行为严重影响了直播平台的正常秩序。而这些机器弹幕从内容上看和正常弹幕相比并没有什么异常,机器会模仿正常用户的弹幕文本,因此识别这些机器弹幕行为存在一定的难度。采用脚本由机器自动发送的弹幕文本为机器弹幕。
一般识别异常发弹幕行为的方法是采用一些强规则,这些规则是通过一些较为明显的异常进行识别的,比如:多个设备公用一个账号发送弹幕,那么这个账号肯定是有较大作弊嫌疑的。采用强规则的方法虽然可以识别出一些风险用户,但是在实际操作的过程中,为了避免误杀会将规则设置的非常严格,因此强规则手段只能找到那些具有明显特征的作弊用户,而容易遗漏那些特征不明显的嫌疑用户,识别准确率较低。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种机器弹幕用户识别方法,通过行为聚集性找到那些潜在的风险用户,判断方式简单且准确性高,有效避免误判情况的产生。
为达到以上目的,本发明采取的技术方案是,包括:
基于刷弹幕风控业务经验确定用户的划分属性,并将相同划分属性的用户划分至同一子空间;
对弹幕发送用户间的相似性进行度量,计算公式为:
其中,wuv是用户u和用户v之间的相似度得分,Ru是用户u发送过弹幕的直播间集合,Rv是用户v发送过弹幕的直播间集合,Iu是用户u使用过的登录IP地址集合,Iv是用户v使用过的登录IP地址集合,Du是用户u发送弹幕使用过的设备集合,Dv是用户v发送弹幕使用过的设备集合,xui是用户u发送弹幕时的第i个特征,xvi是用户v发送弹幕时的第i个特征,N是用户u和用户v发送弹幕时总的特征数,wi(i=1,2,3,4)是权重系数,取值范围为0~1,且满足
对用户u的刷弹幕可疑程度Su进行计算,计算公式为:
其中,当wui≥ξ时,u和v属于E,ξ为设定的可疑程度计算阈值;
若NormSu≥η,则用户u为机器弹幕用户,其中η为设定的机器弹幕判断阈值。
在上述技术方案的基础上,所述划分属性为机器弹幕用户发送弹幕时的相关特征。
在上述技术方案的基础上,机器弹幕用户发送弹幕时的相关特征包括:弹幕内容为纯数字、用户名为纯数字、用户名为纯字母、用户名为数字和字母的组合以及弹幕内容文本。
在上述技术方案的基础上,用户发送弹幕时的特征包括登陆地、登陆设备、弹幕文本长度和弹幕文本内容。
在上述技术方案的基础上,弹幕发送相似性进行度量的两用户属于同一子空间。
本发明还提供一种存储介质,该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810311309.0/2.html,转载请声明来源钻瓜专利网。





