[发明专利]一种基于神经网络模型的虚假新闻检测方法、设备及介质在审
申请号: | 202211435586.5 | 申请日: | 2022-11-16 |
公开(公告)号: | CN115688738A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 李晓瑜;冯落落;李沛 | 申请(专利权)人: | 山东新一代信息产业技术研究院有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/216;G06F18/10;G06F18/213;G06F18/22;G06N3/0464;G06N3/045 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 王彬 |
地址: | 250013 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 模型 虚假 新闻 检测 方法 设备 介质 | ||
本申请公开了一种基于神经网络模型的虚假新闻检测方法、设备及介质,用以解决现有技术无法及时检测到虚假新闻的技术问题。方法包括:生成新闻数据集并进行预处理得到统一格式的新闻数据集;通过词频逆向文件频率算法对新闻标题和新闻正文进行特征提取;通过肘部法则对特征向量去噪得到对应若干个特征向量并计算若干个特征向量之间的余弦相似度;将若干个特征向量划分为多个特征向量集并将特征向量输入至预先训练好的神经网络模型输出新闻标题和新闻正文对应特征向量是否相符的检测结果并确定是否为虚假新闻;将新闻标题和新闻正文对应特征向量所在特征向量集中的其他新闻对应的检测结果与新闻对应的检测结果保持一致,实现对虚假新闻的检测。
技术领域
本申请涉及智能检测技术领域,尤其涉及一种基于神经网络模型的虚假新闻检测方法、设备及介质。
背景技术
近些年来,随着网络信息技术的飞速发展以及手机、平板等移动终端的迭代更新,人们更倾向于从社交媒体、新闻软件上获取最新的新闻。这样的获取方式更加方便快捷,随手转发就能被广泛传播。但是,由于通过社交媒体、新闻软件获取新闻的成本低廉和广泛传播性,随之而来的是新闻消息的真实性引人质疑,每天都会有部分新闻可能是虚假的。这些虚假新闻消息往往流量巨大、博人眼球,但是会对社会和公众产生负面的影响并带来非必要的麻烦。
发明内容
本申请实施例提供了一种基于神经网络模型的虚假新闻检测方法、设备及介质,用以解决现有技术无法自动判断新闻标题与新闻正文是否相符,及时检测到虚假新闻的技术问题。
一方面,本申请实施例提供了一种基于神经网络模型的虚假新闻检测方法,包括:
获取若干个新闻数据,以生成对应的新闻数据集,并对所述新闻数据集中的新闻数据进行预处理,以得到统一格式的新闻数据集;
通过词频逆向文件频率算法,对统一格式的新闻数据集中的新闻标题和新闻正文进行特征提取;
通过肘部法则对所述新闻数据集的新闻标题和新闻正文对应的特征向量进行去噪,以得到所述新闻数据集的新闻标题和新闻正文对应的若干个特征向量,并计算所述若干个特征向量之间的余弦相似度;
根据所述若干个特征向量之间余弦相似度,将所述若干个特征向量划分为多个特征向量集,并分别将所述多个特征向量集中新闻标题和新闻正文对应的特征向量输入至预先训练好的神经网络模型中;所述神经网络模型是基于卷积神经网络和深度神经网络相结合得到的;
通过所述预先训练好的神经网络模型,输出新闻标题和新闻正文对应的特征向量是否相符的检测结果,并根据所述检测结果确定所述新闻标题和新闻正文对应的新闻是否为虚假新闻;
将所述新闻标题和新闻正文对应特征向量所在特征向量集中的其他新闻对应的检测结果,与所述新闻对应的检测结果保持一致,实现对虚假新闻的检测。
在本申请的一种实现方式中,所述获取若干个新闻数据,以生成对应的新闻数据集,并对所述新闻数据集中的新闻数据进行预处理,以得到统一格式的新闻数据集,具体包括:
通过预设方式从网络或应用中获取若干个新闻数据,以生成所述若干个新闻数据对应的新闻数据集,并确定出所述新闻数据集中的新闻标题和新闻正文;
将所述新闻数据集中与判断新闻标题和新闻正文是否相符的无关词语进行删除,以实现对所述新闻数据集中的新闻标题和新闻正文的清洗;所述无关词语至少包括以下一项或多项:标点符号、停用词和语气词;
获得清洗后的新闻标题和新闻正文,并将所述清洗后的新闻标题和新闻正文进行格式转换,以得到统一格式的新闻数据集。
在本申请的一种实现方式中,所述分别将所述多个特征向量集中新闻标题和新闻正文对应的特征向量输入至预先训练好的神经网络模型中之前,所述方法还包括:
将预先确定为虚假新闻的样本新闻,输入至卷积神经网络中进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东新一代信息产业技术研究院有限公司,未经山东新一代信息产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211435586.5/2.html,转载请声明来源钻瓜专利网。