[发明专利]一种基于网络的微博消息可信度判别模型的方法有效
申请号: | 201710609782.2 | 申请日: | 2017-07-25 |
公开(公告)号: | CN107403007B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 段大高;盖新新;韩忠明;莫倩 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06F16/958;G06F40/279 |
代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 李娜 |
地址: | 100048*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 消息 可信度 判别 模型 方法 | ||
本发明是一种基于网络的微博消息可信度判别模型的方法,步骤如下:步骤一:计算先验知识;步骤二:定义网络模式;步骤三:定义元路径并生成网络;步骤四:在异构信息网络上做分类;步骤五:虚假消息识别。本发明的优点及功效:一、将评论网络建模为异构信息网络并在异构信息网络上做分类,这在微博虚假消息识别中是一次创新。二、训练数据不需要标注,节省了人力和时间。三、相比于以往研究中通过最终结果来计算特征的重要性,本发明中将特征权重的计算作为模型的一部分,得到最终分类结果的同时也得到了特征的重要性,并且在分类过程中可以观察到特征权重的变化。四、提高了微博虚假消息识别的准确率。
●技术领域
本发明提供一种基于网络的微博消息可信度判别模型的方法,具体涉及一种将微博消息的评论网络建模为异构信息网络并将消息可信度判别过程映射为异构信息网络上的分类问题的方法,属于数据挖掘技术领域。
●背景技术
微博(microblog)是一种流行的信息发布和共享社交服务,用户可以通过互联网或移动客户端等传播媒介,随时随地表达个人观点与兴趣爱好。微博凭借信息传播的共享性、实时性、互动性以及传播方式的多样性,深刻地影响了人们的生活方式,极大地提升了网络媒体的服务效能。根据中国互联网信息中心(China Internet Network InformationCenter,CINIC)2017年1月发布的全国互联网发展统计报告,我国网民规模达7.31亿,其中微博用户超过2.67亿,占整体网民的36.5%。微博是一种新的自媒体工具,而且其发布信息的门槛较低,任意用户均可通过微博发表个人意见,表达个人情感。微博的此特性使得用户彼此之间的交流更加简单、方便。与此同时,微博独有的信息多样化、表达自由化、传播速度迅速等特性,反而使其成为虚假信息、不实言论传播的绝佳平台,从而促进了微博谣言的产生与扩散。所谓微博谣言,即在微博这个特定的平台上出现并流传的未经官方公开证实或者已经被官方所辟谣的消息。微博上的谣言造成的危害显而易见,轻则损害个人利益,重则引起社会恐慌,损害国家利益。因此如何选择可信度高、有价值的信息,判断并识别虚假信息等,已成为政府、企业及个人密切关注的问题。
目前,关于虚假消息检测的方法主要包括以下两个关键点:①数据集特征选取,即找出虚假消息与正常信息的特征差异从而构建分类器输入的特征向量。目前常见的特征向量是基于消息的、基于用户的、基于话题的、基于传播的、基于内容的以及基于网络的特征。在后续的虚假消息分类预测研究中,大多数研究者都通过在此特征基础上进行舍取和创新,从而提高分类器的准确性。②分类算法的选择,目前常见的分类模型可以分为三大类:基于规则的分类方法(决策树、关联规则等)和基于统计的分类方法(朴素贝叶斯、支持向量机等)以及基于神经网络的分类方法(BP神经网络)。上述分类模型都是使用单一的分类器对微博虚假消息进行检测,准确性不高,并且训练数据要经过标注,浪费大量的人力和时间。因此,本发明提出将消息的评论网络建模为异构信息网络,并在此网络上寻找可用的元路径,然后通过元路径计算特征权重,最后根据特征权重计算评论是虚假评论的概率(虚假信息刚发布的时候,人们倾向于怀疑、判断的态度,本说明中将表征这类态度的评论简称为虚假评论,其余为真实评论)。
●发明内容
1.基本定义
①信息网络:可以用一个图G=(V,E)来表示,其中V为网络中的对象,E为对象之间的链接。在网络中,有一个对象类型映射函数和一个链接类型映射函数ψ:E→R,即每个对象v∈V属于一个特定的对象类型每条链接e∈E属于特定的关系类型ψ(e)∈R。
②异构信息网络:在信息网络基础上,如果对象类型|A|1或关系类型|R|1,网络为异构信息网络。
③网络模式:在异构信息网络G=(V,E)中有对象类型映射和链接类型映射ψ:E→R,网络模式是在对象类型A上定义的图,边为来自R的关系,表示为TG=(A,R)。网络模式描述了一个已给定网络的结构,即网络中存在多少节点及可能存在的边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710609782.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数字化证据管理系统
- 下一篇:一种基于更新序列号眼科影像处理归档的方法