[发明专利]一种对话文本的深度学习情感识别方法在审
申请号: | 202110371956.2 | 申请日: | 2021-04-07 |
公开(公告)号: | CN112967737A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 黄志春;张定国;伍宇文;李韧;康文静 | 申请(专利权)人: | 广州伟宏智能科技有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G10L25/03;G06N3/04;G06N3/08 |
代理公司: | 佛山市神机营专利代理事务所(普通合伙) 44765 | 代理人: | 许尤庆 |
地址: | 510000 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对话 文本 深度 学习 情感 识别 方法 | ||
1.一种对话文本的深度学习情感识别方法,其特征在于,包括以下步骤:
S1、获得文本对话集,对所述文本对话集的语音进行交叠分帧,并以帧为单位提取语音的帧特征;
S2、对语音的帧特征进行时序建模,确定情感语音帧和非情感语音帧;
S3、对情感语音帧进行注意力机制计算,使用Attention机制网络模型计算每一帧对情感识别的重要性,并根据重要性决定使用每一个帧情感信息的多少;
S4、将情感语音提取帧特征之后使用LSTM网络进行编码获得情感语义编码序列,并使用Attention机制计算出一个语义向量将其输入到解码器中进行解码,并经过若干次时间步之后,解码器输出情感识别结果。
2.根据权利要求1所述的一种对话文本的深度学习情感识别方法,其特征在于,所述S2中时序建模包括构建情感语音所对应的情感状态链,由情绪状态和非情绪状态;将整个情感语音样本的标签y在假设的指导下扩展为一个标签序列yseg=(Null,y,Null,...,y,Null);根据yseg中y的个数确定一个文情感语音样本对应的标签序列敛。
3.根据权利要求1所述的一种对话文本的深度学习情感识别方法,其特征在于,所述S2中时序建模采用LSTM-CTC时序深度学习模型,进行建模,并通过时间上误差反向传播算法训练LSTM-CTC网络,使其收敛。
4.根据权利要求1所述的一种对话文本的深度学习情感识别方法,其特征在于,所述Attention机制的语音情感识别模型由两个LSTM网络模型组成,并分别作为编码器和解码器。
5.根据权利要求4所述的一种对话文本的深度学习情感识别方法,其特征在于,所述Attention机制的语音情感识别模型识别流程为:对一个语音样本的情感特征,进行编码器,得到该语音的情感语义编码序列,在得到语音的情感语义编码序列后,将最后一个编码向量输入到解码器之中开始进行情感解码。
6.根据权利要求4所述的一种对话文本的深度学习情感识别方法,其特征在于,所述解码器接收两个输入,一个输入是根据上一时刻注意力计算得到的情感语义向量,另外一个输入是解码器根据上一时刻的情感识别结果对应的情感表示向量。
7.根据权利要求1所述的一种对话文本的深度学习情感识别方法,其特征在于,在S4解码过程中,每一个时间步计算一次对语音情感语义编码序列的注意力,并根据注意力计算情感语义向量作为下一时刻的输入,并且解码器在每一次时间步中都会做一次情感识别判断,判断当前语句属于哪一种情感,并将代表该类情感的表示向量作为下一次时间步的输入,经过若干次时间步之后,解码器输出情感识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州伟宏智能科技有限公司,未经广州伟宏智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110371956.2/1.html,转载请声明来源钻瓜专利网。