[发明专利]一种面向传播不确定性的谣言检测方法及装置在审
申请号: | 202110773341.2 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113626685A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 周薇;卫玲蔚;胡斗;虎嵩林 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 陈艳 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 传播 不确定性 谣言 检测 方法 装置 | ||
本发明涉及一种面向传播不确定性的谣言检测方法及装置,包括:获取社交网络中源博文与转发博文的文本数据及若干传播数据;基于文本数据提取的文本特征,利用传播数据分别构建传播方向的初始传播图G′TD及扩散方向的初始传播图G′BU;对于初始传播图G′TD与初始传播图G′BU,分别利用图卷积网络对边的可靠性进行评估,生成传播图GTD与传播图GBU;基于传播图GTD与传播图GBU中的节点表示HTD与HBU,生成源博文的最终特征表示,以获取谣言检测结果。本发明能够缓解传播结构中不可靠传播关系带来的不确定性问题,有效提高谣言检测的准确率和F1值。
技术领域
本发明涉及数据挖掘技术领域,具体涉及一种面向传播不确定性的谣言检测方法及装置。
背景技术
在新媒体时代,社交媒体网站为用户获取信息、表达意见和相互交流提供了巨大的便利。越来越多的用户热衷于参与社交媒体中热点话题的讨论,并且由于平台的便利性等,使得用户生成内容可以迅速达到广泛受众。然而,社交媒体中也滋生了大量谣言信息的产生与传播,给社会带来危害,严重影响着人们的日常生活和社会的健康发展。因此,如何及时准确地检测出谣言是社交网络分析领域中一个迫切需要的研究课题,有重要的研究意义和现实应用意义。
随着时间的推移,源博文通过一系列的转发或回复传播关系形成了其特定的传播结构。现有研究发现,与真实信息相比,谣言的传播更快、更广、更深。这些结构特征为研究者利用传播数据检测谣言提供了可能。随着深度学习(Deep Learning)和数据挖掘(DataMining)技术的发展,许多方法将源博文的传播数据建模为树结构或图结构,利用深度学习工具学习源博文的特征表示,构建分类器进行检测。
但是,在日益复杂的现代社会,以用户为主要参与者的信息传播具有一定程度的随机性。新用户建立信息传播渠道的随机性、已有用户在从众心理、群体压力等因素作用下产生的无意识传播行为与非理性传播行为等,以及一些不法分子的恶意、虚假等传播行为,在这种环境下,表面上的信息传播路径包含许多噪声,这些使得构建的显式图结构(关系)不一定反映真实的依赖传播关系。这种可观测、可引导的随机扰动增加了信息传播分析中的不确定性建模的难度。现有的方法忽略了噪声引起的传播不确定性问题,容易导致模型学习过程中严重的错误积累,无法捕获更多有用的结构特征,从而限制了现有谣言检测方法的性能。
发明内容
本发明针对主要的技术问题是如何缓解实际传播噪声引起的传播不确定性问题。本发明提供一种面向传播不确定性的谣言检测方法及装置,以提高谣言检测任务的性能。
为实现上述目的,本发明的技术方案如下:
一种面向传播不确定性的谣言检测方法,其步骤包括:
1)获取社交网络中源博文与转发博文的文本数据及若干传播数据,并基于文本数据提取的文本特征,利用传播数据分别构建传播方向的初始传播图G′TD及扩散方向的初始传播图G′BU;
2)对于初始传播图G′TD与初始传播图G′BU,分别利用图卷积网络对边的可靠性进行评估,生成传播图GTD与传播图GBU;
3)基于传播图GTD与传播图GBU中的节点表示HTD与HBU,生成源博文的最终特征表示,以获取谣言检测结果。
进一步地,传播数据包括源博文与转发博文之间及转发博文之间的传播关系集合。
进一步地,文本特征包括:TF-IDF文本特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110773341.2/2.html,转载请声明来源钻瓜专利网。