[发明专利]评估网络空间中文本信息真实性的方法有效
| 申请号: | 201910911775.7 | 申请日: | 2019-09-25 |
| 公开(公告)号: | CN110674257B | 公开(公告)日: | 2022-10-28 |
| 发明(设计)人: | 李金龙;吴钰泽 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/36 |
| 代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 评估 网络 空间 文本 信息 真实性 方法 | ||
本发明公开了一种评估网络空间中文本信息真实性的方法,包括:对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取,并结合设计的实体‑关系规则,建立实体‑关系数据库,再计算各实体‑关系得分;结合实体‑关系得分,构建单条文本信息的实体‑关系网络,从而获得每一单条文本信息的表征向量;利用单条文本信息的表征向量构建文本信息的真实性评估网络,从而对待确定真实性的单条文本信息进行真实性评估。
技术领域
本发明涉及计算机、人工智能、自然语言处理技术领域,尤其涉及一种评估网络空间中文本信息真实性的方法。
背景技术
网络空间中的海量文本信息具有碎片化、社会化、即时性等特点,且由于网络空间中信息真假难辨,因此为了能够更好地提取文本信息中的有效内容,需要一种有效评估文本信息真实性的方法。评估文本信息的真实性是为了表示信息为真实的可能性,真实性大则表示该信息为有效信息的可能性越高,这一评估方法的优劣影响了信息处理过程中对海量信息的利用率。对于文本信息的处理与分类,已经有较多的解决方案,例如CN2018104591390提出一种文本的情感分类方法,CN2017113465570提出一种对短信文本根据内容进行分类的方法。
但是,目前对于文本信息中所反映的内容是否为客观真实的评估,目前还没有较为有效的方案。
发明内容
本发明的目的是提供一种评估网络空间中文本信息真实性的方法,可以准确评估文本信息真实性,填补现有技术的空白。
本发明的目的是通过以下技术方案实现的:
一种评估网络空间中文本信息真实性的方法,包括:
对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取,并结合设计的实体-关系规则,建立实体-关系数据库,再计算各实体-关系得分;
结合实体-关系得分,构建单条文本信息的实体-关系网络,从而获得每一单条文本信息的表征向量;
利用单条文本信息的表征向量构建文本信息的真实性评估网络,从而对待确定真实性的单条文本信息进行真实性评估。
由上述本发明提供的技术方案可以看出,可以抽取文本信息中的实体和实体之间的关系,并对其进行建模成关系网络的形式,在关系网络上运用网络表征学习方法学习文本信息的特征,并准确地评估信息与信息中涉及的实际事件的相关性以及其为真实的可能性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种评估网络空间中文本信息真实性的方法的流程图;
图2为本发明实施例提供的由海量文本信息形成实体-关系库流程图;
图3为本发明实施例提供的神经网络模型的结构示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
本发明实施例提供一种评估网络空间中文本信息真实性的方法,如图1所示,其主要包括:
1、对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取,并结合设计的实体-关系规则,建立实体-关系数据库,再计算各实体-关系得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910911775.7/2.html,转载请声明来源钻瓜专利网。





