[发明专利]基于多分辨率小波的数字助听器语音增强方法无效
申请号: | 201310393791.4 | 申请日: | 2013-09-02 |
公开(公告)号: | CN103475986A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 曹旭来;张玲华 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04R25/00 | 分类号: | H04R25/00 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分辨率 数字 助听器 语音 增强 方法 | ||
技术领域
本发明属于语音信号处理技术领域,特别涉及基于多分辨率小波的数字助听器语音增强方法。
背景技术
数字助听器中涉及的核心算法包括语音增强算法,声源定位算法,回声消除算法,响度补偿算法等。近十年来,现代数字信号处理技术在数字助听器中的应用不断发展,数字助听器性能不断提升,为听障人士的听力恢复作出了很大的贡献。
在数字助听器领域中,如何使助听器在噪声环境中更好的处理语音,从而帮助助听器使用者获得更为清晰的言语信号,一直以来被所有听力学临床工作者和助听器使用者所关注。高品质的降噪能力能够提高助听器的佩戴者的言语理解能力。
虽然数字助听器在过去的十年取得了巨大的进步,但调查发现,只有30%的助听器使用者在对产品满意度调查中表示满意,许多使用者表示有不适的感觉。其中语音增强技术就是影响使用者舒适度的关键性因素之一。
语音增强算法在提高语音清晰度等方面取得了较大的成功,但在可懂度方面的研究比较少。语音可懂度对于听者尤其是听障患者的言语理解能力有十分重要的影响。(HELLGRENJ.Analysis of feedback cancellation in hearing aids with filtered-x LMS and the direct method of closed loop identification[J].IEEE Transactions on Speech and Audio Process.2002,10(2):119-131.)。
目前助听器中最流行的是多通道频率补偿算法(Kwen-SiongChong,Bah-Hwee Gwee,Chang,J.S.A 16-Channel Low-Power Nonuniform Spaced Filter Bank Core for Digital Hearing Aids[C].IEEE Transactions on Circuits and Systems II:ExpressBriefs,2006,53(9):853-857),其基本思想就是把信号按照频率分成多个频带,在每个频带内根据各信号的特性单独进行响度补偿,根据每个频带带宽的划分大小,又分为等带宽(WyrschS.Subband signal processing for hearing aids[C].Proceedings of the 1999 IEEE International Symposium on Circuits and Systems,Jul1999,vol.3,29-32) 和非等带宽的算法(王青云,赵力,赵立业等.一种数字助听器多通道响度补偿方法[J].电子与信息学报,2009,31(4):832-835)。但是语音频谱中的许多重要特征(如基音频率和频谱包络等)对言语的识别具有很重要的意义,多通道频率补偿算法几乎忽略了对这些特征的保护,造成语音结构变形和识别率低等问题。因此,研究可以有效地保留语音特征的单通道语音增强算法,具有很重要的意义。
多分辨率分析是建立在信号和系统的分辨率基础上的。信号具有不同的频率,系统也有各自的系统带宽,系统的分辨率与该系统中的信号频率和系统带宽密切相关。带宽宽则分辨率高;反之,分辨率低。子波变换是傅里叶变换的发展,它具有多种形式,其中小波变换就是一种多分辨率分析的子波变换方法。
发明内容
本发明的目的在于克服现有技术的不足,提出基于多分辨率小波的数字助听器语音增强方法。所述方法解决了传统多通道补偿算法忽略保护语音特征,造成语音结构变形和识别率低的问题,有效提高增强语音的可懂度,使得患者听起来更舒适,在提高患者听力水平的同时增强其言语辨别力。
为了解决上述技术问题,本发明采用的技术方案是:基于多分辨率小波的数字助听器语音增强方法,包括步骤如下:
步骤A,音频预处理,首先对原始音频信号进行分帧处理,分帧后计算每帧音频信号的频谱;
步骤B,小波分解与重构,利用多分辨率小波对信号声压级频谱进行小波分解,获得信号声压级频谱的离散平滑逼近和式,再重构音频信号声压级频谱,由此获得声压级频谱的平滑拟合曲线;
步骤C,提取特征点,检测出重构后的音频声压级频谱包络的各极值所在,确定为音频频谱的特征点;
步骤D,单通道压缩放大,根据病患的听力特性曲线计算各特征点的增益值;利用插值算法,获得全频带增益特性曲线;由计算得出的全频带增益特性,对原音频信号频谱进行增益补偿,使得声音强度始终处于患者的最适域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310393791.4/2.html,转载请声明来源钻瓜专利网。