[发明专利]噪声环境下人工耳蜗信号的说话人可懂性检测方法有效
申请号: | 201711111307.9 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107767859B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 林琳;孙晓颖;陈建;杨鹏;王程;王秀成;赵静仪 | 申请(专利权)人: | 吉林大学 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L25/27;G10L25/45;G10L25/51;G10L15/14 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 魏征骥 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 环境 人工 耳蜗 信号 说话 人可懂性 检测 方法 | ||
本发明涉及一种噪声环境下人工耳蜗信号的说话人可懂性检测方法,属于语音信号处理领域。纯净参考语音信号首先经过人工耳蜗处理算法并进行波形重构,得到经人工耳蜗处理后的纯净语音。再经过特征提取后,建立特定说话人的语音模型;识别阶段,纯净识别语音加噪声后,形成带噪识别语音,进行特征提取后,与说话可懂性模型进行匹配,得到最终的检测结果。优点在于:为提高人工耳蜗用户的语音感知力提供了一个重要的理论依据,减少噪声在匹配过程中的影响,提高检测的准确性,采用基于动态Gammachirp滤波器组的组合特征参数,进一步提高检测方法的噪声鲁棒性。
技术领域
本发明涉及语音信号处理领域,特别是对经过人工耳蜗处理后的语音信号,在噪声环境下对不同说话人语音可懂度的检测方法。
背景技术
目前,人工耳蜗的研究主要集中在人工耳蜗对声音处理的方法、人工耳蜗用户对不同语音的可懂度,以及对人工耳蜗装置或系统的开发及改进等,如专利CN103892939A、CN101716108A、CN101953722A等是从人工耳蜗对声音的处理方法进行了研究;专利CN101770549A公开了一种基于“虚拟处理器”的言语处理策略自动检测方法及检测系统,对人工耳蜗处理算法实现的正确性进行检测等。目前大多数研究更关注不同处理算法的改进,以提高人工耳蜗用户对语音的可懂度,其焦点更加关注对每一个语音的识别,而不考虑说话人的因素。
不同说话人语音的可懂性差别很大,有些说话人的语音更容易让人听懂。这些差别很大程度上来自他们的语音特性,比如人说话时的平均语速、平均基音频率、谱均衡等。对于正常听力的听者,在安静的环境下,不同说话人的这些差异对听者听到的内容和进行语音交流的影响几乎很小。然而,与正常听力的听者不同,使用人工耳蜗的听者,即使在安静的环境下,对连续的对话语音的内容有时都很难听懂。说话人的语速越快,人工耳蜗使用者对语音的理解度就越差。实际噪声的存在使得人工耳蜗使用者对语音的理解度急剧下降。因此,如何提高噪声环境下人工耳蜗用户对说话人语音的可懂度,是当前人工耳蜗领域研究的一个热点问题。
发明内容
本发明提供一种噪声环境下人工耳蜗信号的说话人可懂性检测方法,以噪声环境下人工耳蜗处理后的汉语语音信号为研究对象,建立其对不同说话人语音可懂度的模型,从而实现人工耳蜗用户的说话人语音可懂度的检测。
本发明采取的技术方案是,包括下列步骤:
(一)人工耳蜗处理过程如下:
(1)、语音信号的预处理
语音信号的预处理包括端点检测、均方根归一化、将输入信号采样率调整为Fs、预加重、分帧和加窗,得到预处理后N个帧长为L的短时帧信号;
(2)、对预处理后的语音信号进行FFT带通滤波器组滤波,包括以下步骤:
1)对加窗的短时帧信号进行FFT变换,计算每个短时帧频谱S(l,i);其中i=1,…,N表示第i个短时帧,l表示每个短时帧第l个频率点取值,l=0,1,2,…,L-1;
2)利用Nc个通道带通滤波器组对每个短时帧频谱进行滤波,保留落入相应通道频率范围的频率分量,其余频率分量滤除;
(3)、各通道包络提取
采用希尔伯特变换的方式,提取每个短时帧信号频谱中的包络,令j表示第j个通道的带通滤波器,其中j=1,…,Nc;q表示第j个带通滤波器通带内对应频率节点的个数,则经过FFT带通滤波器组后得到的每个通道的包络F(j,i);
式中,Fs为信号的采样率,ck为通道增益系数,k=1,2,…,Nc,满足
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711111307.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音处理方法、装置及服务器
- 下一篇:语音数据处理方法、系统及存储介质