[发明专利]一种基于记忆的门控卷积神经网络语义处理系统及方法有效

申请号：	202011562801.9	申请日：	2020-12-25
公开（公告）号：	CN112598065B	公开（公告）日：	2023-05-30
发明（设计）人：	李晓捷;金日泽;张卫民	申请（专利权）人：	天津工业大学
主分类号：	G06F18/241	分类号：	G06F18/241;G06N3/0464;G06N3/048;G06N3/063;G06N3/084;G06F40/30
代理公司：	北京沁优知识产权代理有限公司 11684	代理人：	李蓓蕾
地址：	300000 ***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于记忆门控卷积神经网络语义处理系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于记忆的门控卷积神经网络语义处理方法，可应用于一种基于记忆的门控卷积神经网络语义处理系统，该系统包括输入单元、与输入单元连接的分层处理单元以及与分层处理单元连接的记忆单元，所述分层处理单元包括卷积处理层、门控卷积处理层以及残差网络处理层，所述卷积处理层与所述门控卷积处理层连接，若干个所述门控卷积处理层之间连接有一所述残差网络处理层；上述方法的特征在于，包括如下步骤：

S1：输入单元采用词嵌入矩阵将文本数据转换为特征向量；

S2：卷积处理层依据特征向量提取卷积特征图；

具体地，卷积处理层对特征向量进行正常的卷积运算，设定x_i∈R^d是一段语句中第i个词向量表示，其中，向量长度为d，一个长度为n的句子可以表示为一个矩阵：x_1:n∈R^nd，参数大小为w∈R^hd的卷积核一次操作于h个单词，在时刻t获取的线性组合特征值c_t可以定义为：

c_t＝x_t:t+h-1·w+b

b∈R为偏置量，t的定义域为t∈[1,n-h+1]，卷积处理层连续作用于所有输入并合并结果得到一个特征图，输出到门控卷积处理层中，进行门控卷积处理；

S3：经过若干门控卷积处理层多次处理得到多层级语义表征数据，并将多层级语义表征数据传递到记忆单元进行存储，并更新记忆单元中的数据；

S4：依据注意力机制从记忆单元更新后的数据中提取语义特征值；

S5：分类层依据语义特征值得到文本的分类结果。

2.根据权利要求1所述的一种基于记忆的门控卷积神经网络语义处理方法，其特征在于，在步骤S3中，在门控卷积处理层中还包括如下步骤：

S301：对输入X∈R^Nm使用第二卷积计算模块进行卷积计算得到矩阵A，其中A＝(X·W+b)；

S302：同时对输入X∈R^Nm使用门控卷积计算模块计算得到矩阵B，其中B＝(X·V+c)，再将B通过sigmoid非线性转换后得到门控参数σ；

S303：将矩阵A和B依据公式计算得到该门控卷积处理层的输出；