[发明专利]一种基于对抗学习的端到端的跨语言语音情感识别方法有效

专利信息
申请号: 201910731716.1 申请日: 2019-08-08
公开(公告)号: CN110364186B 公开(公告)日: 2021-06-25
发明(设计)人: 吴志勇;代东洋 申请(专利权)人: 清华大学深圳研究生院
主分类号: G10L25/63 分类号: G10L25/63;G10L25/30;G10L25/03
代理公司: 深圳新创友知识产权代理有限公司 44223 代理人: 江耀纯
地址: 518055 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 对抗 学习 端到端 语言 语音 情感 识别 方法
【说明书】:

发明提供一种基于对抗学习的端到端的跨语言语音情感识别方法,包括:构建包括特征提取器、情感分类器和语言分类器的情感识别模型;接收原始数据对所述情感识别模型进行训练并在训练过程中使用梯度翻转层;利用训练好的所述情感识别模型预测源语言语音或目标语言语音的情感。通过构建包括特征提取器、情感分类器和语言分类器的情感识别模型,直接接受语音波形或者语谱图作为输入,不再需要其他数据预处理工作,免除了特征工程的工作;模型训练时采用梯度反转层以促进特征提取器提取语言无关的信息,适用于模型训练时一种语言的语音数据有大量的情感标签而其他语言的语音数据没有足够情感标签甚至没有情感标签的情况。

技术领域

本发明涉及情感识别技术领域,尤其涉及一种基于对抗学习的端到端的跨语言语音情感识别方法。

背景技术

从语音中识别情感有利于构建更自然的人机语音交互系统。传统的方法需要一定的专家知识从语音中提取有效的特征进行情感识别。随着神经网络的兴起,越来越多的研究人员尝试构建基于神经网络的端到端语音情感识别模型,利用神经网络从原始数据(语音波形或语谱图)中直接提取特征用于情感识别。端到端的语音情感识别模型去除了繁琐昂贵的特征工程工作,并在数据规模较大的情况下取得了超越传统方法的效果。

在语音情感识别的研究和应用中,会遇到对多种语言进行情感识别的需求。甚至某些语言的情感数据资源非常丰富(有大量的带情感标签的语音)。而某些语音的情感数据资源相对比较匮乏(语料库中有很少情感标签或没有情感标签)。称情感数据资源丰富的语言为源语言,情感数据资源匮乏的语言成为目标语言。如何根据源语言语音的丰富的情感数据资源,提升模型在目标语言语音上的情感识别性能,即跨语言语音情感识别,一直是一个值得研究的问题。

现有的跨语言语音情感识别方法是基于传统的语音情感识别方法的,需要大量的特征工程或者手工提取特征的工作。

发明内容

本发明为了解决现有技术中语音情感识别方法需要大量的特征工程通过手工提取特征的工作的问题,提供一种基于对抗学习的端到端的跨语言语音情感识别方法。

为了解决上述问题,本发明采用的技术方案如下所述:

一种基于对抗学习的端到端的跨语言语音情感识别方法,包括如下步骤:S1:构建包括特征提取器、情感分类器和语言分类器的情感识别模型,S2:接收原始数据对所述情感识别模型进行训练并在训练过程中使用梯度翻转层;S3:利用训练好的所述情感识别模型预测源语言语音或目标语言语音的情感。

优选地,所述训练过程包括如下步骤:S21:所述特征提取器接收源语言语音和目标语言语音的所述原始数据作为输入并提取特征用于所述情感分类器和所述语言分类器;S22:筛选出对应所述源语言语音的特征作为所述情感分类器的输入得到情感标签,所述源语言语音和所述目标语言语音的特征经过一个梯度翻转层进入所述语言分类器得到语言标签。

优选地,所述源语言语音的数据有情感标签和语言标签;所述目标语言语音的数据仅有语言标签,或有语言标签和情感标签。

优选地,定义损失函数Le和Ll,其中Le根据所述情感分类器的输出与所述情感标签的差异而计算;Ll根据所述语言分类器和所述语言标签的差异而计算,则所述情感识别模型的总的损失函数L=Le+λLl,其中λ为权衡两个算是函数的权重系数。

优选地,所述情感分类器的参数θe按照公式更新,其中μ0为学习率;所述语言分类器的参数θl按照公式更新;所述特征提取器的参数θf按照公式更新。

优选地,训练过程中使用验证集,所述验证集上的损失函数Le和Ll不再降低时训练结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910731716.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top