[发明专利]面向大数据文本挖掘的动态认知语义匹配方法有效

专利信息
申请号: 202010263232.1 申请日: 2020-04-05
公开(公告)号: CN111552816B 公开(公告)日: 2022-07-19
发明(设计)人: 赵安平;于宇 申请(专利权)人: 温州大学
主分类号: G06F16/36 分类号: G06F16/36;G06F40/30;G06N3/04;G06N3/08
代理公司: 温州金瓯专利事务所(普通合伙) 33237 代理人: 林益建
地址: 325000 浙江省温州市瓯海*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 面向 数据 文本 挖掘 动态 认知 语义 匹配 方法
【说明书】:

发明公开了一种面向大数据文本挖掘的动态认知语义匹配方法,通过对大数据文本空间进行文本特征和语义空间的量子认知表示,得到表征大数据文本空间语义空间的线性组合,针对所述线性组合采用基于量子概率的关联语义空间发现方法获取所述大数据文本空间的语义表示和语义建模,根据语义表示和语义建模进行建模,得到初始匹配模型,采用深度神经网络针对所述初始匹配模型计算词间的语义关系,获得动态认知语义空间预测模型,采用动态认知语义空间预测模型对待匹配语句进行语义匹配,以实现对待匹配语句的语义匹配。

技术领域

本发明涉及面向大数据文本挖掘技术领域,尤其涉及一种面向大数据文本挖掘的动态认知语义匹配方法。

背景技术

大数据时代,从海量的非结构化文本数据中挖掘其潜在的价值,成为大数据处理技术研究的主要动力。综合分析国内外研究和技术现状,在面向大数据文本挖掘的过程中,以人的认知规律为驱动、语义智能化的动态认知语义空间匹配方面还存在三个主要问题:

1)研究的对象是大数据文本,不能采用传统的认知语义空间方法思路,更多的应该考虑在特定情境下的认知的局部的形式化,需要建立在动态语义进化情境下,建模能够可靠合理解释和评价的语义空间匹配来模拟人的各种认知心理现象。

2)面向大数据文本挖掘过程中出现全新涌现语义等现象,不能采用传统的经典概率理论框架来解释,因此,建模不同的观测视角的自然语言意义理解和语义匹配,传统方法存在一定局限性,许多现成的文本挖掘理论的结果和工具不能直接利用。

3)针对大数据文本挖掘技术中具有关键支撑作用的、符合人类认知规律的动态认知语义匹配的各个因素还需继续提炼,松散性的语义关联不能充分应用于海量的文本数据中发现新的模式、模型、规则、趋势等知识。

因此,研究如何以符合人类认知规律的方式进行认知语义匹配来支持智能的大数据文本挖掘过程,并且描述和解释在此过程中经典概率理论无法解释的人类自然语言理解和认知过程,是目前亟待解决的课题。

发明内容

针对以上问题,本发明提出一种面向大数据文本挖掘的动态认知语义匹配方法。

为实现本发明的目的,提供一种面向大数据文本挖掘的动态认知语义匹配方法,包括如下步骤:

S10,对大数据文本空间进行文本特征和语义空间的量子认知表示,得到表征大数据文本空间语义空间的线性组合;

S20,针对所述线性组合采用基于量子概率的关联语义空间发现方法获取所述大数据文本空间的语义表示和语义建模,根据语义表示和语义建模进行建模,得到初始匹配模型;

S30,采用深度神经网络针对所述初始匹配模型计算词间的语义关系,获得动态认知语义空间预测模型,采用动态认知语义空间预测模型对待匹配语句进行语义匹配。

在一个实施例中,所述对大数据文本空间进行文本特征和语义空间的量子认知表示,得到表征大数据文本空间语义空间的线性组合包括:

基于量子认知理论中对情境的隐含考虑,获取大数据文本空间的基本状态所构成的量子态向量;

根据所述量子态向量采用超空间模拟语言模型在量子认知和语义空间之间建立关联,将大数据文本空间的文本特征和语义空间嵌入到量子理论中,以将量子描述方法引入代表人类认知行为现象的认知语义空间,得到表征大数据文本空间语义空间的线性组合。

作为一个实施例,所述量子态向量包括:

B={|S1,K,|Sn},

其中|Si表示第i个基本状态,B表示量子态向量,i的取值为1、Λ、n。

在一个实施例中,所述针对所述线性组合采用基于量子概率的关联语义空间发现方法获取所述大数据文本空间的语义表示和语义建模包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010263232.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top