[发明专利]带噪语音情感识别方法、系统、设备及存储介质有效
申请号: | 202110332451.5 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113053417B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 姜晓庆;陈贞翔;杨倩;郑永强 | 申请(专利权)人: | 济南大学;山东思正信息科技有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/87;G10L25/30 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情感 识别 方法 系统 设备 存储 介质 | ||
本发明公开了带噪语音情感识别方法、系统、设备及存储介质,获取待识别的带噪语音信号;对待识别的带噪语音信号进行端点检测处理;根据端点得到若干个有声音的语音片段;对有声音的语音片段进行特征提取,得到语音特征;将语音特征输入到训练后的语音情感识别模型中,输出情感类别。端点检测方法可以在样本重建过程中,计算正交匹配追踪算法算法迭代过程中预测残差与上一次迭代的信号估计值之间的条件熵,根据迭代前后的残差条件熵差值,在样本重建完成的同时直接给出重建样本的端点检测结果,充分利用样本重建过程中产生的数据,节省系统后续的分析与处理时间,且由于该端点检测方法是建立在压缩感知重建算法之上的,具有抗噪性能。
技术领域
本申请涉及语音情感识别技术领域,特别是涉及带噪语音情感识别方法、系统、设备及存储介质。
背景技术
本部分的陈述仅仅是提到了与本申请相关的背景技术,并不必然构成现有技术。
语音端点检测方法在语音信号处理领域中有广泛且重要的应用,对于减少处理的数据量、语音的有效特征学习、语音识别及语音情感识别的精确度等方面具有重要的研究意义。
无处不在噪声的存在往往使语音端点检测准确度下降,目前研究已表明压缩感知(Compressed Sensing,CS)在语音信号的去噪方面也具有优越的性能。根据CS理论,语音信号在经适当的稀疏基与观测矩阵变换后所获得的观测值中包含了语音信号中的全部有用信息,观测值经传输后在接收端可采用一定的重建算法可重建语音信号,而噪声无法实现稀疏性因而不可重建,所以压缩感知在大大减少语音传输数据量的同时、在重建过程中同时也实现了去噪处理。同时,由于语音信号中的清音段具有类噪声特性,在重建过程中会被抑制,使重建样本的清浊划分更为准确,有助于提高后续语音特征参数的提取精确度。现有研究也表明,压缩感知理论下的重建语音样本可以有效应用于带噪语音情感识别。
在以往的研究中,人们关注的重点在于信号重建,忽视重建过程中产生的参数及数据的特性的研究与应用,造成数据资源的浪费。比如若对重建样本需要进行语音样本端点检测,则需要在获取重建样本之后,然后对重建样本采用某种端点检测算法进行分析,无法实现重建的同时给出端点检测结果,所以现有的端点检测处理方法无疑会增加系统处理的时延。另外,现有的端点检测算法均是基于语音信号本身进行处理,数据维度高,运算效率低。
发明内容
为了解决现有技术的不足,本申请提供了带噪语音情感识别方法及系统;
第一方面,本申请提供了带噪语音情感识别方法;
带噪语音情感识别方法,包括:
获取待识别的带噪语音信号;
对待识别的带噪语音信号进行端点检测处理;根据端点得到若干个有声音的语音片段;
对有声音的语音片段进行特征提取,得到语音特征;
将语音特征输入到训练后的语音情感识别模型中,输出情感类别。
第二方面,本申请提供了带噪语音情感识别系统;
带噪语音情感识别系统,包括:
获取模块,其被配置为:获取待识别的带噪语音信号;
端点检测模块,其被配置为:对待识别的带噪语音信号进行端点检测处理;根据端点得到若干个有声音的语音片段;
特征提取模块,其被配置为:对有声音的语音片段进行特征提取,得到语音特征;
输出模块,其被配置为:将语音特征输入到训练后的语音情感识别模型中,输出情感类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学;山东思正信息科技有限公司,未经济南大学;山东思正信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110332451.5/2.html,转载请声明来源钻瓜专利网。