[发明专利]基于复数谱的语音抑郁水平检测方法及其系统在审
| 申请号: | 202210094644.6 | 申请日: | 2022-01-26 |
| 公开(公告)号: | CN114627855A | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 范存航;汪锦勤;吕钊;李太豪;裴冠雄 | 申请(专利权)人: | 之江实验室;安徽大学 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L19/08;G10L25/06;G10L25/51;G10L25/63 |
| 代理公司: | 合肥市上嘉专利代理事务所(普通合伙) 34125 | 代理人: | 李璐 |
| 地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 复数 语音 抑郁 水平 检测 方法 及其 系统 | ||
本发明公开了一种基于复数谱的语音抑郁水平检测方法,包括以下步骤:S1:提取原始语音波形的复数谱,作为语音抑郁水平预测的输入特征;S2:采用深层语音特征提取器对特征的通道之间的相互依赖性建模,获取区分性声学特征;S3:采用两层卷积神经网络将频率信道压缩成一维,获取只有时间维度的深度语音特征;S4:采用注意时间池获取低维语音表征的长期相关性,并根据注意机制动态选择更重要的信息,获得相对应的预测结果。还公开了一种基于复数谱的语音抑郁水平检测系统。本发明首次将复数谱用于语音抑郁水平检测,能够显著提高语音抑郁水平检测的准确率。
技术领域
本发明涉及语音抑郁症检测技术领域,特别是涉及一种基于复数谱的语音抑郁水平检测方法及其系统。
背景技术
抑郁症是一种常见的精神障碍,语音信号能够反映人们的情绪和压力。此外,生理学研究还表明,抑郁个体和正常个体之间的语音信号不同。基于上述研究结果,已经提出了许多基于语音信号预测抑郁水平的工作。自动语音抑郁水平预测(speech depressionlevel prediction,SDLP)是情感计算中一个非常具有挑战性的问题。有许多研究已经为SDLP取得了相当好的性能。然而,这些研究中的大多数输入语音特征都是基于幅度谱的,从而丢失了相位谱信息。因此,这些语音特征可能会丢失一些与抑郁症相关的重要信息。
具有代表性的深层语音特征可以提高预测性能,然而,很多特征是基于幅度谱的,其丢失了相位谱信息。相位谱可能包含SDLP的许多重要信息,许多研究表明,相位谱对语音质量和可懂度非常重要,因此,放弃这些信息是不合理的。目前的工作主要集中在两个方面:1)改善音频的声学特征;2)设计新的分类模型。幅度谱和相位谱是基于傅里叶变换得到的两种基本的声学特征,反映音频的不同特性。在早期研究中,主要对幅度谱进行处理而忽视相位谱信息,相位信息对于语音抑郁症检测任务非常重要,与幅度谱相比,相位谱可能包含了更多语音抑郁水平检测的重要信息,因此如何有效利用语音特征信息是一个具有挑战性的问题。
因此亟需提供一种新型的语音抑郁水平检测方法来解决上述问题。
发明内容
本发明所要解决的技术问题是提供一种基于复数谱的语音抑郁水平检测方法及其系统,能够显著提高语音抑郁症检测技术的准确率。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于复数谱的语音抑郁水平检测方法,包括以下步骤:
S1:提取原始语音波形的复数谱,作为自动语音抑郁水平预测的输入特征;
S2:采用深层语音特征提取器对特征的通道之间的相互依赖性建模,获取区分性声学特征;
S3:用两层卷积神经网络将频率信道压缩成一维,获取只有时间维度的深度语音特征;
S4:采用注意时间池获取低维语音表征的长期相关性,并根据注意机制动态选择更重要的信息,获得相对应的预测结果。
在本发明一个较佳实施例中,步骤S1的具体步骤包括:
S101:利用短时傅里叶变换STFT将时域语音信号转换为时频域:
Real[t,f]+i*Imag[t,f]=STFT(x[k]) (1)
其中,x[k]表示时域中的语音信号,k是语音信号的时间索引,Real和Imag是STFT的相应实部和虚部,t是时间帧数的索引,f是频率单元的索引;
S102:将STFT的实数部分和虚数部分拼接在一起,得到需要的复数谱特征,表示为:
其中,stack表示拼接操作,F和T分别为频率和时间帧数。
在本发明一个较佳实施例中,步骤S2的具体步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;安徽大学,未经之江实验室;安徽大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210094644.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种家居稳定互联的远程智能系统
- 下一篇:智能化视频人物替换方法、系统





