[发明专利]基于举报信息和传播异构图的谣言检测方法和系统在审
申请号: | 202210788962.2 | 申请日: | 2022-07-06 |
公开(公告)号: | CN115114500A | 公开(公告)日: | 2022-09-27 |
发明(设计)人: | 余昊晴;马颖华;陈秀真;刘淑婷 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9536;G06N3/04;G06N3/08 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 举报 信息 传播 构图 谣言 检测 方法 系统 | ||
本发明提供了一种基于举报信息和传播异构图的谣言检测方法和系统,包括:获取存在谣言传播的主题关键词;根据主题关键词爬取与主题相关的数据,包括信息、信息发布者数据以及信息转发、点赞用户数据;利用获取的信息、信息发布者数据以及信息转发、点赞用户数据,确定节点种类、节点标签和边关系矩阵,并生成信息异构传播图,根据标注的信息节点标签,通过降低训练集的损失之和,完成图注意力神经网络的训练;基于信息异构传播图,利用转发及发布信息的所有用户真实性概率结果均值计算该条信息的真实性。本发明的高预测准确率减少了人工判断虚假新闻的成本;使用图注意力网络训练时,仅采用少量样本训练,符合真实社交网络环境。
技术领域
本发明涉及谣言检测技术领域,具体地,涉及一种基于举报信息和传播异构图的谣 言检测方法和系统。
背景技术
社交网络平台用户与日俱增。与用户扩增趋势同步的是,有目的性制造引导性信息 的用户增多,人们出于自身的商业或者其他利益发表各类竞争性言论及虚假信息。谣言检测能维护社交网络安全及稳定性,避免对社会产生不良影响,避免对经济造成损失。
专利文献CN112270174A(申请号:CN202011245739.0)公开了一种谣言检测方法及计算机可读存储介质,方法包括:对于社交平台上的每一条动态,收集动态所有的回 复和/或转发,将动态视作一个节点,则动态回复和/或转发为所述动态的子节点,节点 和所述子节点构成一颗传播树;确定传播树中各个节点包含的子节点的数目并从多到少 排序,依序选取至少一个节点与其所包含的子节点构成传播树的关键子树;关键子树中 的根节点为源节点;基于每个关键子树中每个节点和每个子节点的原始数据计算所述传 播树特征,特征包括文本内容相关特征、用户相关特征、传播结构相关特征;构建SLS 神经网络模型用于学习特征;训练SLS神经网络模型并对社交平台上的动态进行谣言检 测。
专利文献CN113934882A(申请号:CN202111152971.4)公开了一种细粒度的多模态虚假新闻检测方法,为:获取待检测多模态新闻的新闻文本和新闻图片;从新闻文本 中提取人物类型、地点类型和事件类型的文本实体;从新闻图片中提取图片文本,人物 类型、地点类型和事件类型的视觉实体,以及新闻图片的视觉CNN特征;将新闻文本 与图片文本拼接后输入BERT模型,获得文本特征;使用BERT模型获取人物类型、地 点类型和事件类型视觉实体的视觉实体特征;融合上述特征,获得文本表示、视觉CNN 表示和视觉实体表示;基于特征向量计算跨模态的人物相似度、地点相似度和事件相似 度;基于上述信息计算所述多模态新闻的多模态表示;基于多模态新闻的多模态表示判 断该多模态新闻的真实性。
过去的研究以挖掘文本内容特征为主,然而,学者未能考虑到谣言在格式、用词上对真实新闻的模仿层出不穷,让人难以辨别。此外,外部知识库不能覆盖所有信息,情 感分析算法难以挖掘文本内容中反讽、反问、诱导的真正意图。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于举报信息和传播异构图的谣 言检测方法和系统。
根据本发明提供的基于举报信息和传播异构图的谣言检测方法,包括:
步骤1:获取存在谣言传播的主题关键词;
步骤2:根据主题关键词爬取与主题相关的数据,包括信息、信息发布者数据以及信息转发、点赞用户数据;
步骤3:利用获取的信息、信息发布者数据以及信息转发、点赞用户数据,确定节点种类、节点标签和边关系矩阵,并生成信息异构传播图,根据标注的信息节点标签, 通过降低训练集的损失之和,完成图注意力神经网络的训练;
步骤4:基于信息异构传播图,利用转发及发布信息的所有用户真实性概率结果均值计算该条信息的真实性。
优选的,节点种类包括用户节点和信息节点,节点之间的边关系包括转发关系和发 布关系,发布关系和转发关系均使用边关系矩阵进行表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210788962.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置