[发明专利]基于多注意力机制的问题分类方法、系统及存储介质有效
申请号: | 201910958230.1 | 申请日: | 2019-10-10 |
公开(公告)号: | CN110727765B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 余本功;朱梦迪;汲浩敏;王胡燕;张强;杨善林 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;刘兵 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 问题 分类 方法 系统 存储 介质 | ||
1.一种基于多注意力机制的问题分类方法,其特征在于,所述问题分类方法包括:
获取待分类的文本Q={q1,...,qn},其中,q1,...,qn为所述文本Q中的词语;
采用word2vec模型将所述文本Q转化为对应的词向量序列X={x1,...xi,...,xn},其中,xi为词向量序列X中的第i个向量,且1≤i≤n,n为所述词向量序列X中向量的数量;
根据所述词向量序列X形成基于疑问词注意力机制的词向量矩阵;
采用预设的标注集对所述文本Q进行词性标注并编码以形成词性向量序列
采用公式(1)分别计算所述词向量序列X中的每个向量xi的系数,
其中,为向量xi的系数,为所述词性向量序列Xp的第i个向量,Wp为对应的自注意力机制的参数矩阵,bp为对应的自注意力机制的线性偏差;
采用公式(2)对每个所述系数进行标准化处理,
其中,为经过标准化处理后的向量xi的系数,n为所述词向量序列X中的向量的数量;
采用公式(3)确定基于词性注意力机制的词向量矩阵,
其中,为基于词性注意力机制的词向量矩阵的第i个向量;
采用卷积神经网络根据基于所述疑问词注意力机制得到的词向量矩阵和所述词性注意力机制得到的词向量矩阵形成用于表示所述文本的局部特征的组合矩阵;
采用LSTM神经网络将所述组合矩阵转化为具有时序特征的特征矩阵;
采用公式(4)确定所述特征矩阵中每个向量的系数,
at=σ(WLTht+bLT), (4)
其中,at为所述特征矩阵中向量ht的系数,向量ht为所述LSTM神经网络的输出,WLT为对应的自注意力机制的参数矩阵,bLT为对应的自注意力机制的线性偏差;
采用公式(5)对每个所述系数at进行标准化处理以得到所述特征矩阵中每个向量的权重,
其中,A为所述特征矩阵的权重,at为所述特征矩阵中的第t个向量的系数;
采用公式(6)确定所述文本的特征向量,
T=AH, (6)
其中,T为所述特征向量,H为所述特征矩阵;
将所述特征向量输入分类器中以得到所述文本的类别;
所述根据所述词向量序列X形成基于疑问词注意力机制的词向量矩阵包括:
提取所述词向量序列X中的表示疑问词的疑问词向量xe;
采用公式(7)分别对所述疑问词向量xe和所述词向量序列X中的每个向量xi进行内积运算以得到所述疑问词向量xe对每个所述向量xi的系数,
其中,为向量xi的系数,xe为所述疑问词向量,innerproduct为所述内积运算;
采用公式(8)对系数进行标准化处理,
其中,为经过标准化处理后的向量xi的系数;
所述采用卷积神经网络根据基于所述疑问词注意力机制得到的词向量矩阵和所述词性注意力机制得到的词向量矩阵形成用于表示所述文本的局部特征的组合矩阵包括:
分别从基于疑问词注意力机制得到的词向量矩阵和基于词性注意力机制得到的词向量矩阵中选取出对应的滑动窗口矩阵,对选取出的滑动窗口矩阵进行卷积计算以得到第一组合矩阵和第二组合矩阵,其中所述第一组合矩阵和所述第二组合矩阵均包括多个向量,每个向量包括多个元素;
将所述第一组合矩阵和所述第二组合矩阵按照每个元素在对应的向量中的次序进行重排以形成所述组合矩阵;
所述分别从基于疑问词注意力机制得到的词向量矩阵和基于词性注意力机制得到的词向量矩阵中选取出对应的滑动窗口矩阵,对选取出的滑动窗口矩阵进行卷积计算以得到第一组合矩阵和第二组合矩阵包括:
根据公式(9)和公式(10)进行所述卷积计算,
其中,和为所述第一组合矩阵和所述第二组合矩阵中的元素,和为所述滑动窗口矩阵,we和wp为对应的卷积神经网络的参数矩阵,be、bp为对应的卷积神经网络的线性偏差,f为卷积神经网络的激活函数;
所述将所述第一组合矩阵和所述第二组合矩阵按照每个元素在对应的向量中的次序进行重排以形成所述组合矩阵包括:
根据公式(11)进行所述重排,
其中,为第一组合矩阵和第二组合矩阵中每个向量的第i个元素组成的新的向量,为所述第一组合矩阵中的向量,为所述第二组合矩阵中的向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910958230.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种话术生成方法、装置及话术生成设备
- 下一篇:敏感词的检测方法