[发明专利]一种基于长短时记忆网络快速识别语音情感类别的方法在审
申请号: | 202110485958.4 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113053418A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 颜思瑞;丁凯星;谢跃;陈允韬;王超 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L25/03 |
代理公司: | 南京创略知识产权代理事务所(普通合伙) 32358 | 代理人: | 吕娟 |
地址: | 211167 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 短时记忆 网络 快速 识别 语音 情感 类别 方法 | ||
1.一种基于长短时记忆网络快速识别语音情感类别的方法,其特征在于,包括以下步骤:
S1、从原始语音数据样本中提取具有时序信息的帧级语音特征;
S2、通过软注意力模型创建基于注意力机制的改进型LSTM模型;
S3、用已知的原始语音数据样本及其语音情感类别对步骤S2中创建好的改进型LSTM模型进行训练,训练好后得到情感类别识别模型;
S4、对步骤S3得到的情感类别识别模型进行情感识别测试验证;
S5、将未知的原始语音数据样本输入情感类别识别模型进行识别,输出对应的语音情感类别。
2.根据权利要求1所述的一种基于长短时记忆网络快速识别语音情感类别的方法,其特征在于,步骤S2中通过软注意力模型创建基于注意力机制的改进型LSTM模型,包括以下步骤:
S21、用软注意力模型中的注意力门替代常规型LSTM模型中的遗忘门以得到新遗忘门;
S22、以步骤S21得到的新遗忘门与常规型LSTM模型中输入控制门的对偶关系,取代常规型LSTM模型中的输入控制门,得到注意力机制的改进型LSTM模型。
3.根据权利要求2所述的一种基于长短时记忆网络快速识别语音情感类别的方法,其特征在于,步骤S21中,用软注意力模型中的注意力门替代常规型LSTM模型中的遗忘门以得到新遗忘门,包括如下步骤:
S21.1、对常规型LSTM模型进行分析,利用LSTM引入细胞结构,通过自循环方式,使得常规型LSTM模型能够关联RNN过去的历史序列,其具体计算公式如下:
ft=σ(Wf·[ht-1,xt,Ct-1]+bf) (1)
it=σ(Wi·[ht-1,xt,Ct-1]+bi) (2)
ot=σ(Wo·[ht-1,xt,Ct]+bo) (5)
ht=ot*tanh(Ct) (6)
其中,σ为sigmoid激活函数,其取值范围在[0,1]之间,代表了遗忘历史细胞状态的概率;tanh为双曲正切激活函数;ht-1为t-1时刻的隐层输出,ft、it、ot分别为遗忘门,输入控制门和输出门,Wf和bf分别是遗忘门的权重和偏置,Wi和bi分别是输入控制门的权重和偏置,WC和bC分别是细胞状态的权重和偏置,Wo和bo分别是输出门的权重和偏置,它们是常规型LSTM模型的待训练参数,xt为t时刻的输入,Ct和Ct-1分别为t与t-1时刻的细胞状态,为t时刻的细胞状态候选值;
S21.2、通过注意力机制优化了常规型LSTM内部的遗忘门计算方式,ft与it取值在0到1之间,它们分别是历史细胞状态与候选细胞状态的加权分数,如公式(4)所示;
步骤S22中,以步骤S21得到的新遗忘门与常规型LSTM模型中输入控制门的对偶关系,取代常规型LSTM模型中的输入控制门,得到注意力机制的改进型LSTM模型,包括以下步骤:
S22.1、通过注意力机制来计算历史细胞状态与候选细胞状态的加权分数,替代常规型LSTM模型中的遗忘门与输入控制门,得到新的细胞状态,新的细胞状态更新公式如下:
其中sh和sc分别是历史细胞状态和候选细胞状态的加权系数,它们是依据历史细胞状态与当前候选细胞状态进行计算的,与当前输入和历史输出无关,其中Wh与Wc均是注意力公式里的待学习权重参数,exp是以e为底的指数函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110485958.4/1.html,转载请声明来源钻瓜专利网。