[发明专利]微博水军识别方法与设备有效

专利信息
申请号: 201310154376.3 申请日: 2013-04-28
公开(公告)号: CN103198161B 公开(公告)日: 2018-09-07
发明(设计)人: 张国清;边建功;傅川;李彦君 申请(专利权)人: 中国科学院计算技术研究所
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京泛华伟业知识产权代理有限公司 11280 代理人: 王勇
地址: 100190 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 水军 识别 方法 设备
【说明书】:

发明提供用于微博平台的水军识别方法及设备,包括单个用户水军识别和一条微博的转发、评论用户水军识别。单个用户的识别过程为,对于待识别的微博用户,基于从微博平台采集的与该微博用户相关的信息评估该用户在微博平台上的成本;然后根据该用户在微博平台上的成本来判断该用户是否为水军。一条微博的转发、评论用户的识别过程主要基于单个用户水军识别,但是对评论用户增加了基于用户评论相似性进行识别的方法。该方法能有效地识别微博平台中的水军用户。而且基于用户评论的相似性的识别,更能能够有效识别团伙水军。

技术领域

本发明涉及网络数据分析,尤其涉及识别微博平台中水军的方法。

背景技术

微博作为一种新的社交媒体普及率越来越高。微博这一平台为大众提供了信息发布与获取的共享平台,用户可以随时随地记录和分享学习、工作、生活的各个方面。内容发布的便利性、及时性、丰富性,信息传播的便捷性、时效性、扩展性,为用户信息获取、信息传播、营销等提供了很好的平台,这也促使更多的个人用户、企业用户,甚至是政府部门和政府官员加入到这个平台中来,而他们的加入进一步丰富了系统的用户和内容,微博平台的价值日益凸显。正是这个平台的巨大价值使得很多的用户花费很多时间和精力来提高自己在这个平台的影响力或者充分利用这个平台提供的资源。然而也有一些用户,既包括个人用户、企业用户,也包括一些政府或者组织的用户雇佣水军来达到自己特定的目的。而且微博上用户的行为较之其它平台也更加的复杂,如有的用户是一个正常用户但是可能临时被雇佣来为某用户的微博造势,对该微博进行转发或者评论。由于微博平台作为一种新的社交网络出现的时间还不长,水军问题还没有得到应有的重视,还缺乏有效的水军识别方法。

微博水军有两种,一种是指由机器人或者真正的人操纵的账号,这些账号用来给系统中某用户增加粉丝(俗称僵尸粉),另一种是指由机器算法操纵或者由其它的用户来操纵为他人转发评论造势的微博账户。

在微博平台中一些用户尤其是名人用户,其影响力或者在系统中被推荐给其它用户的概率、或者在系统中曝光的频率,与其粉丝的数量有很大的关系,与其微博在平台中被转发和评论的次数也有很大的关系。因此一些用户就通过购买水军为其粉丝、通过雇佣水军对其微博进行转发和评论的方式来增加个人在平台的影响力或者排名。通过判定一个用户是否是水军,可以识别系统中用户的粉丝中真实用户的数量,从而可以帮助判定一个用户的真正的影响力,从而在系统的用户推荐等部分做出更合理的判断。

用户为了增加自己在平台的影响力而雇佣水军为其粉丝或者转发评论其微博对平台系统产生了一些负面的影响。还有两种情况可能比这种情况对系统的影响更大,甚至有时候误导平台的用户。一种情况是系统中的用户,包括个人用户、企业用户、组织等,发布了一条微博,然后雇佣水军对该微博进行转发和评论,从而达到某种宣传或者炒作的效果。另一种情况是雇佣水军对竞争对手的微博进行恶意评论,诋毁竞争对手,或者制造一些虚假信息雇佣水军来进行转发、评论来欺骗或者煽动群众。这两种情况对系统中的用户来讲,有可能被一些虚假信息蒙蔽或者对假信息信以为真,对微博平台来讲有可能需要更多地存储、计算等资源,甚至影响到平台上用户的体验造成用户的流失,对社会来讲有可能舆论会受到微博平台的影响,从而影响更多的人。

传统的网络水军识别的方法主要针对论坛、博客等平台来进行,而且大部分是根据用户的帖子的内容如情感性倾向等来进行。而微博平台与其它的很多平台相比有很大的不同之处,首先用户在微博上的信息更加公开化,其次用户微博的内容被限制为140个字符采用传统的语义分析的方法行不通,最后微博水军的定义更加模糊,用户可能只是在某条微博的转发评论中表现出水军的性质。因此,亟需一种在微博平台中进行水军识别的方法。

发明内容

因此,本发明的目的在于克服上述现有技术的缺陷,提供针对单个用户的微博水军识别方法以及针对一条微博的转发和评论情况对转发用户和评论用户进行水军识别的方法。

本发明的目的是通过以下技术方案实现的:

一方面,本发明提供了一种针对单个用户的微博水军识别方法,该方法包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310154376.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top