[发明专利]面向大数据文本挖掘的动态认知语义匹配方法有效
申请号: | 202010263232.1 | 申请日: | 2020-04-05 |
公开(公告)号: | CN111552816B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 赵安平;于宇 | 申请(专利权)人: | 温州大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 温州金瓯专利事务所(普通合伙) 33237 | 代理人: | 林益建 |
地址: | 325000 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 数据 文本 挖掘 动态 认知 语义 匹配 方法 | ||
本发明公开了一种面向大数据文本挖掘的动态认知语义匹配方法,通过对大数据文本空间进行文本特征和语义空间的量子认知表示,得到表征大数据文本空间语义空间的线性组合,针对所述线性组合采用基于量子概率的关联语义空间发现方法获取所述大数据文本空间的语义表示和语义建模,根据语义表示和语义建模进行建模,得到初始匹配模型,采用深度神经网络针对所述初始匹配模型计算词间的语义关系,获得动态认知语义空间预测模型,采用动态认知语义空间预测模型对待匹配语句进行语义匹配,以实现对待匹配语句的语义匹配。
技术领域
本发明涉及面向大数据文本挖掘技术领域,尤其涉及一种面向大数据文本挖掘的动态认知语义匹配方法。
背景技术
大数据时代,从海量的非结构化文本数据中挖掘其潜在的价值,成为大数据处理技术研究的主要动力。综合分析国内外研究和技术现状,在面向大数据文本挖掘的过程中,以人的认知规律为驱动、语义智能化的动态认知语义空间匹配方面还存在三个主要问题:
1)研究的对象是大数据文本,不能采用传统的认知语义空间方法思路,更多的应该考虑在特定情境下的认知的局部的形式化,需要建立在动态语义进化情境下,建模能够可靠合理解释和评价的语义空间匹配来模拟人的各种认知心理现象。
2)面向大数据文本挖掘过程中出现全新涌现语义等现象,不能采用传统的经典概率理论框架来解释,因此,建模不同的观测视角的自然语言意义理解和语义匹配,传统方法存在一定局限性,许多现成的文本挖掘理论的结果和工具不能直接利用。
3)针对大数据文本挖掘技术中具有关键支撑作用的、符合人类认知规律的动态认知语义匹配的各个因素还需继续提炼,松散性的语义关联不能充分应用于海量的文本数据中发现新的模式、模型、规则、趋势等知识。
因此,研究如何以符合人类认知规律的方式进行认知语义匹配来支持智能的大数据文本挖掘过程,并且描述和解释在此过程中经典概率理论无法解释的人类自然语言理解和认知过程,是目前亟待解决的课题。
发明内容
针对以上问题,本发明提出一种面向大数据文本挖掘的动态认知语义匹配方法。
为实现本发明的目的,提供一种面向大数据文本挖掘的动态认知语义匹配方法,包括如下步骤:
S10,对大数据文本空间进行文本特征和语义空间的量子认知表示,得到表征大数据文本空间语义空间的线性组合;
S20,针对所述线性组合采用基于量子概率的关联语义空间发现方法获取所述大数据文本空间的语义表示和语义建模,根据语义表示和语义建模进行建模,得到初始匹配模型;
S30,采用深度神经网络针对所述初始匹配模型计算词间的语义关系,获得动态认知语义空间预测模型,采用动态认知语义空间预测模型对待匹配语句进行语义匹配。
在一个实施例中,所述对大数据文本空间进行文本特征和语义空间的量子认知表示,得到表征大数据文本空间语义空间的线性组合包括:
基于量子认知理论中对情境的隐含考虑,获取大数据文本空间的基本状态所构成的量子态向量;
根据所述量子态向量采用超空间模拟语言模型在量子认知和语义空间之间建立关联,将大数据文本空间的文本特征和语义空间嵌入到量子理论中,以将量子描述方法引入代表人类认知行为现象的认知语义空间,得到表征大数据文本空间语义空间的线性组合。
作为一个实施例,所述量子态向量包括:
B={|S1,K,|Sn},
其中|Si表示第i个基本状态,B表示量子态向量,i的取值为1、Λ、n。
在一个实施例中,所述针对所述线性组合采用基于量子概率的关联语义空间发现方法获取所述大数据文本空间的语义表示和语义建模包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010263232.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电力工程用电力接地桩
- 下一篇:用于癌症免疫治疗的肽及其肽组合物
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置