[发明专利]一种基于神经网络模型的虚假新闻检测方法、设备及介质在审
申请号: | 202211435586.5 | 申请日: | 2022-11-16 |
公开(公告)号: | CN115688738A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 李晓瑜;冯落落;李沛 | 申请(专利权)人: | 山东新一代信息产业技术研究院有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/216;G06F18/10;G06F18/213;G06F18/22;G06N3/0464;G06N3/045 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 王彬 |
地址: | 250013 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 模型 虚假 新闻 检测 方法 设备 介质 | ||
1.一种基于神经网络模型的虚假新闻检测方法,其特征在于,所述方法包括:
获取若干个新闻数据,以生成对应的新闻数据集,并对所述新闻数据集中的新闻数据进行预处理,以得到统一格式的新闻数据集;
通过词频逆向文件频率算法,对统一格式的新闻数据集中的新闻标题和新闻正文进行特征提取;
通过肘部法则对所述新闻数据集的新闻标题和新闻正文对应的特征向量进行去噪,以得到所述新闻数据集的新闻标题和新闻正文对应的若干个特征向量,并计算所述若干个特征向量之间的余弦相似度;
根据所述若干个特征向量之间余弦相似度,将所述若干个特征向量划分为多个特征向量集,并分别将所述多个特征向量集中新闻标题和新闻正文对应的特征向量输入至预先训练好的神经网络模型中;所述神经网络模型是基于卷积神经网络和深度神经网络相结合得到的;
通过所述预先训练好的神经网络模型,输出新闻标题和新闻正文对应的特征向量是否相符的检测结果,并根据所述检测结果确定所述新闻标题和新闻正文对应的新闻是否为虚假新闻;
将所述新闻标题和新闻正文对应特征向量所在特征向量集中的其他新闻对应的检测结果,与所述新闻对应的检测结果保持一致,实现对虚假新闻的检测。
2.根据权利要求1所述的一种基于神经网络模型的虚假新闻检测方法,其特征在于,所述获取若干个新闻数据,以生成对应的新闻数据集,并对所述新闻数据集中的新闻数据进行预处理,以得到统一格式的新闻数据集,具体包括:
通过预设方式从网络或应用中获取若干个新闻数据,以生成所述若干个新闻数据对应的新闻数据集,并确定出所述新闻数据集中的新闻标题和新闻正文;
将所述新闻数据集中与判断新闻标题和新闻正文是否相符的无关词语进行删除,以实现对所述新闻数据集中的新闻标题和新闻正文的清洗;所述无关词语至少包括以下一项或多项:标点符号、停用词和语气词;
获得清洗后的新闻标题和新闻正文,并将所述清洗后的新闻标题和新闻正文进行格式转换,以得到统一格式的新闻数据集。
3.根据权利要求1所述的一种基于神经网络模型的虚假新闻检测方法,其特征在于,所述分别将所述多个特征向量集中新闻标题和新闻正文对应的特征向量输入至预先训练好的神经网络模型中之前,所述方法还包括:
将预先确定为虚假新闻的样本新闻,输入至卷积神经网络中进行训练;
通过所述卷积神经网络的卷积层,提取所述样本新闻中的属性特征;所述属性特征包括:新闻标题、新闻正文;
在所述属性特征经过池化层池化的情况下,通过所述卷积神经网络的全连接层,输出所述样本新闻是否为虚假新闻的检测结果,直至输出所述样本新闻是否为虚假新闻的检测结果与预先确定的所述样本新闻为虚假新闻的结果相匹配,得到神经网络模型。
4.根据权利要求3所述的一种基于神经网络模型的虚假新闻检测方法,其特征在于,所述得到神经网络模型之后,所述方法还包括:
通过深度神经网络,对所述样本新闻中各属性特征对应的权重进行调整,以得到所述神经网络模型中的目标属性特征权重;
基于所述目标属性特征权重,对所述神经网络模型进行优化,以完成对所述神经网络模型的训练。
5.根据权利要求1所述的一种基于神经网络模型的虚假新闻检测方法,其特征在于,所述通过词频逆向文件频率算法,对统一格式的新闻数据集中的新闻标题和新闻正文进行特征提取,具体包括:
确定出统一格式的新闻数据集中的新闻标题以及对应的新闻正文,并通过词频逆向文件频率算法,对所述新闻标题和所述对应的新闻正文进行编码,以生成所述新闻标题对应的编码列表和所述新闻正文对应的编码列表;
根据所述新闻标题对应的编码列表,对所述新闻标题进行特征提取,以及根据所述新闻正文对应的编码列表,对所述新闻正文进行特征提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东新一代信息产业技术研究院有限公司,未经山东新一代信息产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211435586.5/1.html,转载请声明来源钻瓜专利网。