[发明专利]一种语音情感识别方法、装置及存储介质有效
| 申请号: | 202110086550.X | 申请日: | 2021-01-22 |
| 公开(公告)号: | CN112885378B | 公开(公告)日: | 2023-03-24 |
| 发明(设计)人: | 刘振焘;吴保晗;佘锦华;吴敏;熊永华;周莉;赵兴旺 | 申请(专利权)人: | 中国地质大学(武汉) |
| 主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/30;G06F18/214;G06F18/2415;G06N3/082 |
| 代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 张毅 |
| 地址: | 430000 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 情感 识别 方法 装置 存储 介质 | ||
本发明提供了一种语音情感识别方法、装置及存储介质,涉及人工智能技术领域。目前语音情感识别的方法主要包括:基于深度神经网络进行识别和传统的机器学习方法,但主流方法仍是深度学习。基于深度学习的方法主要是将经过预处理后的语音信号进行特征提取,然后送入到深度神经网络里面进行训练,接着通过支持向量机、决策树等方法进行分类。这些方法各有优势,但在实际应用中都需要大量带标签的数据,而当样本数据不足时,容易出现过拟合现象,无法进行准确的识别。本公开的有益效果是有效改善了在深度神经网络中由于样本数量不足而产生的过拟合现象,并提高训练的效率与准确性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音情感识别方法、装置及存储介质。
背景技术
目前,应用于人类情感识别研究的检测信息包括语音、面部表情、生理信号、肢体语言等。语音是人与人之间沟通最快且最自然的方法,语音情感识别研究对促进和谐人机交互意义重大。
随着大规模标定数据集和深度神经网络结构的提出,深度学习算法在语音情感识别上取得了相对较高的识别准确率。然而,这些成就都是基于大量标签数据,使用深度模型训练,迭代更新模型参数实现的。现实环境往往要比公开的实验数据集更加复杂,构造一个能够覆盖完整样本分布的语音数据集,需要耗费大量的人力和财力去采集数据和标定数据,并且某些语言很难采集到充足的语料。
发明内容
本公开解决的一个技术问题是,如何利用少量样本数据来训练一个模型,改善在深度神经网络中由于样本数量不足而产生的过拟合现象。
根据本公开的一个方面,提供了一种语音情感识别方法包括:获取大规模语音情感数据集;构建深度强化学习模型;将大规模语音情感数据集输入深度强化学习模型中对深度神经网络进行预训练;将预训练好的所述深度神经网络迁移至元学习模型,形成深度神经网络模型;获取小样本语音情感数据集;将所述小样本语音情感数据集输入所述深度神经网络模型中对深度神经网络进行元训练;对经过元训练的深度神经网络模型进行元测试,并输出语音情感识别结果。
在一些实施例中,构建深度强化学习模型包括:深度学习框架包括智能体和环境,将深度神经网络嵌入到智能体中,构成深度强化学习模型;
在一些实施例中,将大规模语音情感数据集输入深度强化学习模型中对深度神经网络进行预训练包括:在大规模语音情感数据集中获取第一语音情感信号;对第一语音情感信号进行预处理;从经过预处理后的第一语音情感信号中提取第一语音情感特征;将第一语音情感特征输入到深度强化学习模型中进行训练。
在一些实施例中,将小样本语音情感数据集输入所述深度神经网络模型中对深度神经网络模型进行元训练包括:将深度神经网络模型的第一分类层替换成符合小样本数据类别的第二分类层;将小样本语音情感数据集划分为训练集和测试集;在训练集和所述测试集中获取第二语音情感信号;对第二语音情感信号进行预处理;从经过预处理后的所述第二语音情感信号中提取第二语音情感特征;将训练集中提取的第二语音情感特征输入深度神经网络模型中对深度神经网络进行元训练。
在一些实施例中,所述识别方法包括:将训练集划分为第一支持集和第一查询集;将第一支持集得到的损失值更新第二分类层的参数,并将第一查询集得到的损失值作为参数更新缩放移动函数;将测试集分为第二支持集和第二查询集,利用第二支持集对第二分类层的参数进行微调;利用第二查询集输出语音情感识别结果并评估深度神经网络模型。
根据本公开的另一个方面,提供一种语音情感识别装置,包括:深度强化学习模块,用于输入大规模语音情感数据集并对深度神经网络进行预训练;迁移学习模块,用于将预训练后的深度神经网络迁移至元学习模型形成深度神经网络模型;深度神经网络模块,用于输入小样本语音情感数据集对深度神经网络模型进行元训练,对经过元训练的深度神经网络模型进行元测试,并输出语音情感识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110086550.X/2.html,转载请声明来源钻瓜专利网。





