[发明专利]评估网络空间中文本信息真实性的方法有效

申请号：	201910911775.7	申请日：	2019-09-25
公开（公告）号：	CN110674257B	公开（公告）日：	2022-10-28
发明（设计）人：	李金龙;吴钰泽	申请（专利权）人：	中国科学技术大学
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/35;G06F16/36
代理公司：	北京凯特来知识产权代理有限公司 11260	代理人：	郑立明;郑哲
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	评估网络空间文本信息真实性方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种评估网络空间中文本信息真实性的方法，包括：对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取，并结合设计的实体‑关系规则，建立实体‑关系数据库，再计算各实体‑关系得分；结合实体‑关系得分，构建单条文本信息的实体‑关系网络，从而获得每一单条文本信息的表征向量；利用单条文本信息的表征向量构建文本信息的真实性评估网络，从而对待确定真实性的单条文本信息进行真实性评估。

技术领域

本发明涉及计算机、人工智能、自然语言处理技术领域，尤其涉及一种评估网络空间中文本信息真实性的方法。

背景技术

网络空间中的海量文本信息具有碎片化、社会化、即时性等特点，且由于网络空间中信息真假难辨，因此为了能够更好地提取文本信息中的有效内容，需要一种有效评估文本信息真实性的方法。评估文本信息的真实性是为了表示信息为真实的可能性，真实性大则表示该信息为有效信息的可能性越高，这一评估方法的优劣影响了信息处理过程中对海量信息的利用率。对于文本信息的处理与分类，已经有较多的解决方案，例如CN2018104591390提出一种文本的情感分类方法，CN2017113465570提出一种对短信文本根据内容进行分类的方法。

但是，目前对于文本信息中所反映的内容是否为客观真实的评估，目前还没有较为有效的方案。

发明内容

本发明的目的是提供一种评估网络空间中文本信息真实性的方法，可以准确评估文本信息真实性，填补现有技术的空白。

本发明的目的是通过以下技术方案实现的：

一种评估网络空间中文本信息真实性的方法，包括：

对部分带有真实标签且文本信息数量满足要求的文本信息库中的命名实体进行抽取，并结合设计的实体-关系规则，建立实体-关系数据库，再计算各实体-关系得分；

结合实体-关系得分，构建单条文本信息的实体-关系网络，从而获得每一单条文本信息的表征向量；

利用单条文本信息的表征向量构建文本信息的真实性评估网络，从而对待确定真实性的单条文本信息进行真实性评估。

由上述本发明提供的技术方案可以看出，可以抽取文本信息中的实体和实体之间的关系，并对其进行建模成关系网络的形式，在关系网络上运用网络表征学习方法学习文本信息的特征，并准确地评估信息与信息中涉及的实际事件的相关性以及其为真实的可能性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种评估网络空间中文本信息真实性的方法的流程图；