[发明专利]混合神经网络融合Attention机制的小麦抗寒性识别方法有效
| 申请号: | 202010459587.8 | 申请日: | 2020-05-27 |
| 公开(公告)号: | CN111651980B | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 李艳翠;来纯晓;金松林;韩博;闫思尧;冯洪玉;张顺利;李晓辉 | 申请(专利权)人: | 河南师范大学;河南科技学院 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F16/35;G06N3/0442;G06N3/0464;G06Q50/02 |
| 代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 张真真 |
| 地址: | 453000 河*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 混合 神经网络 融合 attention 机制 小麦 抗寒性 识别 方法 | ||
1.一种基于混合神经网络融合Attention机制的小麦抗寒性识别方法,其特征在于,其步骤如下:
S1、将小麦特征文本转换为特征向量输入词向量层,得到小麦文本向量;
S11、将小麦特征文本映射到d维向量空间,得到文本特征词序列X=(x1,x2,…,xL-1,xL),其中,L表示输入小麦特征文本经过分词后的特征词的个数;
S12、利用Word2vec网络模型对特征词进行训练作为特征向量输入词向量层,得到小麦文本向量X∈RL·d;
S2、将小麦文本向量分别输入卷积神经网络I、卷积神经网络II、卷积神经网络III中,得到局部特征信息I、局部特征信息II、局部特征信息III;
所述步骤S2中的卷积神经网络I包括卷积层I和池化层I,所述卷积神经网络II包括卷积层II和池化层II,所述卷积神经网络III包括卷积层III和池化层III;
所述将小麦文本向量分别输入卷积神经网络I、卷积神经网络II、卷积神经网络III,得到局部特征信息I、局部特征信息II、局部特征信息III的方法为:
S21、利用卷积层I、卷积层II、卷积层III分别对小麦文本向量X∈RL·d进行卷积,得到卷积特征值:
其中,表示每个窗口在第n个位置的卷积特征值,Wm为卷积核的权重值Wm∈Rm·d,xn:n+m-1表示从n到n+m-1共m行向量,bm∈Rd为偏置,为卷积运算,f(x)为激活函数,m表示卷积核窗口,卷积核的尺寸为K∈Rm·d,m=3,4,5,滑动步长为1,K∈R3·d对应卷积层I的卷积核,K∈R4·d对应卷积层II的卷积核,K∈R5·d对应卷积层III的卷积核,d表示特征词的向量维度;
S22、小麦文本向量X∈RL·d经过第m个卷积核卷积操作后得到的特征信息为:
S23、利用池化层I对卷积层I输出的特征信息进行降维操作,得到局部特征信息I:
其中,l表示卷积核的数量,表示卷积核K∈R3·d对应的第z个最大化特征值,z=1,2,…,l;
S24、利用池化层II对卷积层II输出的特征信息进行降维操作,得到局部特征信息II:
其中,表示卷积核K∈R4·d对应的第z个最大化特征值;
S25、利用池化层III对卷积层III输出的特征信息进行降维操作,得到局部特征信息III:
其中,表示卷积核K∈R5·d对应的第z个最大化特征值;
S3、将局部特征信息I、局部特征信息II、局部特征信息III输入到拼接层进行拼接得到全局特征信息;
S4、将全局特征信息输入BiLSTM网络中得到小麦文本向量之间的序列特征信息;
S5、利用注意力机制对序列特征信息进行权重分配,得到小麦文本特征向量;
S6、利用Sigmoid激活函数对小麦文本特征向量进行分类,输出分类结果。
2.根据权利要求1所述的基于混合神经网络融合Attention机制的小麦抗寒性识别方法,其特征在于,所述全局特征信息为:其中,Fv表示第v个最大化特征值,v=1,2,…,3l。
3.根据权利要求1所述的基于混合神经网络融合Attention机制的小麦抗寒性识别方法,其特征在于,所述将全局特征信息输入BiLSTM网络中得到小麦文本向量之间的序列特征信息的方法为:其中,ht表示序列特征信息,Wt表示前向方向上输出的权重矩阵,Vt表示后向方向上输出的权重矩阵,bt表示的是偏置值,表示t时刻LSTM网络在正方向上的输出,表示t时刻LSTM网络在反方向上的输出,xt为BiLSTM模型在t时刻的输入。
4.根据权利要求1所述的基于混合神经网络融合Attention机制的小麦抗寒性识别方法,其特征在于,所述利用注意力机制对序列特征信息进行权重分配,得到小麦文本特征向量的方法为:s=∑tαt·μt,其中,αt=exp(μtT·μw)/∑texp(μtT·μw)表示序列特征信息ht对分类判定的贡献度,μw表示随机初始化的数值,μt==tanh(Ww·ht+bw)表示第t时刻由上一网络层输出向量ht所决定的注意力概率分布值,Ww为注意力层的权重矩阵,bw为偏置项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南师范大学;河南科技学院,未经河南师范大学;河南科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010459587.8/1.html,转载请声明来源钻瓜专利网。





