[发明专利]基于图神经网络特征聚合的谣言检测方法及装置有效
申请号: | 202110402464.5 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113139052B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 马凯;刘小迪;徐守志;马圆圆;向舜陟 | 申请(专利权)人: | 三峡大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨云云 |
地址: | 443002 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 特征 聚合 谣言 检测 方法 装置 | ||
本发明提供一种基于图神经网络特征聚合的谣言检测方法及装置,方法包括:获取第一事件源文本图;将第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;将待检测的第一事件源文本图输入至图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测。所述装置用于执行上述方法。本发明提供的基于图神经网络特征聚合的谣言检测方法,使用得到的图神经网络预测模型对互联网的事件源文本及响应推文进行检测,能够保留社交媒体中的信息传播结构,更好地将事件的响应推文特征与事件源推文特征相融合,从文本级粒度和词语级粒度进行谣言判别。
技术领域
本发明涉及大数据挖掘技术领域,尤其涉及一种基于图神经网络特征聚合的谣言检测方法及装置。
背景技术
谣言指没有相应事实基础,却被捏造出来并通过一定手段推动传播的言论。社交媒体上的谣言具有碎片化、网络化、范围广、速度快的特点。谣言检测技术和方法通过对现有计算机相关知识和技能的运用,在网络社交平台上对谣言进行识别。
现有谣言检测技术存在如下问题:1)现有的谣言检测研究无法较好地捕捉到文本中上下文及前后词的关系;2)谣言检测研究使用频率较高的文本向量化方法word2vec和GloVe无法将一词多义现象和上下文语境在词向量中体现出来;3)现有的基于图的研究倾向于从单一粒度入手对谣言文本或谣言传播结构进行谣言检测。
发明内容
本发明提供的基于图神经网络特征聚合的谣言检测方法,用于克服现有技术中存在的至少一个问题,使用得到的图神经网络预测模型对互联网的事件源文本及响应推文进行检测,能够保留社交媒体中的信息传播结构,更好地将事件的响应推文特征与事件源推文特征相融合,从文本级粒度和词语级粒度进行谣言判别。本发明提供一种基于图神经网络特征聚合的谣言检测方法,包括:
获取第一事件源文本图;
将所述第一事件源文本图和训练标签输入至预设第一图神经网络模型进行训练,以确定图神经网络预测模型;
将待检测的第一事件源文本图输入至所述图神经网络预测模型,以对互联网中的事件源文本及响应推文进行谣言检测;
其中,事件源文本图是通过将所述事件源文本进行图结构建模得到的;
所述训练标签是通过采用预设编码方式对所述事件源文本和所述响应推文进行标注后得到的。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述获取第一事件源文本图,包括
对事件源推文预处理,并对预处理后的事件源推文进行图结构建模,以获取第二事件源推文图;
将所述第二事件源推文图输入至训练好的第二图神经网络模型,以获取事件源推文的文本级特征向量;
根据事件源文本的词向量和所述文本级特征向量,获取所述第一事件源文本图;
其中,所述事件源推文包括所述事件源文本和所述响应推文。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述对事件源推文预处理,包括:
去除所述事件源文本中的乱码数据和空行数据;以及
去除所述事件源的响应推文的冗余项;
其中,所述冗余项包括转发但未评论的事件源的响应推文、乱码数据和空行数据。
根据本发明提供的一种基于图神经网络特征聚合的谣言检测方法,所述事件源文本的词向量通过如下方式获取:
去除所述事件源文本中的乱码数据和空行数据,获取满足预设条件的事件源文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110402464.5/2.html,转载请声明来源钻瓜专利网。