[发明专利]人工耳蜗听觉场景识别方法在审
申请号: | 201811276582.0 | 申请日: | 2018-10-30 |
公开(公告)号: | CN109448702A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 樊伟;刘新东;刘根芳;魏清 | 申请(专利权)人: | 上海力声特医学科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/16;G10L15/26;G10L25/18;G10L25/45 |
代理公司: | 上海申浩律师事务所 31280 | 代理人: | 唐佳弟;秦华毅 |
地址: | 201318 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 听觉场景 人工耳蜗 特征提取 程序模块 语音处理器 场景 预处理程序模块 预处理 信号处理模块 输出 场景识别 刺激信号 加窗处理 信号处理 音乐场景 语音信号 语音增强 噪声环境 可懂度 概率 分帧 预设 植入 匹配 运算 判定 相符 | ||
本发明公开了一种人工耳蜗听觉场景识别方法,其包括如下步骤:(A)预处理程序模块将声音信号进行分帧与加窗处理;(B)特征提取程序模块将预处理后的声音信号进行特征提取;(C)场景识别程序模块将特征提取后的声音信号进行CNN运算,得出各预设场景的概率值,将概率值最大的场景判定为最终场景并输出。该通过CNN处理,能识别不同的听觉场景,为语音处理器后续语音增强及言语策略等信号处理模块提供指示,使语音处理器的信号处理与听觉场景更加匹配,输出与实际听觉场景更加相符的刺激信号,提高患者在噪声环境下的语音信号的清晰度、可懂度,同时还可提高音乐场景下的聆听效果,进一步改善人工耳蜗植入患者的生活质量。
技术领域
本发明涉及一种听觉场景识别方法,尤其涉及一种人工耳蜗听觉场景识别方法。
背景技术
人工耳蜗是目前世界公认的能使双侧重度或极重度感音神经性耳聋患者恢复听觉的唯一有效方法及装置。现有的人工耳蜗运作流程为:声音先由麦克风采集转换为电信号,经过特殊的数字化处理,再按照一定的策略编码,通过载在耳后的发射线圈传送到体内,植入体的接收线圈感应到信号后,经过解码芯片解码,使植入体的刺激电极产生电流,从而刺激听神经产生听觉。由于使用环境的限制,声音中必然掺杂着环境杂音,需要对声音信号进行一定的算法优化,但鉴于使用环境的多样化,如果只使用单一算法优化,则算法优化后的信号有时会与实际情况有所偏差,无法达到最佳的听觉效果,故需要一种听觉场景的识别方法,使得不同场景使用不同的优化算法,已达到最佳的听觉效果。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种人工耳蜗听觉场景识别方法,其能识别不同的听觉场景。
为实现上述目的,本发明提供了一种人工耳蜗听觉场景识别方法,其包括如下步骤:(A)预处理程序模块将声音信号进行分帧与加窗处理;(B)特征提取程序模块将预处理后的声音信号进行特征提取;(C)场景识别程序模块将特征提取后的声音信号进行CNN运算,得出各预设场景的概率值,将概率值最大的场景判定为最终场景。
在步骤A中,该加窗处理使用Hamming窗或Hanning窗。
进一步,Hamming窗:其中,窗长N=256,帧移取128。
在步骤B中,该特征向量提取采用MFCC、FBank或语谱图。
进一步,Fbank的特征提取方法:对预处理输出的每一帧声音信号进行FFT变换:X[i,k]=FFT[xi(m)];对每一帧FFT后的数据计算谱线能量:E[i,k]=[xi(k)]2;计算Mel滤波器能量:其中,Hm(k)为Mel滤波器的频率响应,m为Mel滤波器个数,这里取40;取对数运算:Fbank=log[S(i,m)]。
在步骤C中,该CNN包括输入层,中间层及输出层,其中,该输入层为声音信号特征构成的二维数据矩阵,该中间层包括卷积输出层,池化输出层以及全连接输出层,该全连接输出层由一个一维数据组成,该池化输出层比该卷积输出层少一个。
进一步,池化处理采用Maxpooling或Meanpooling。
再进一步,激活函数使用ReLU、sigmoid、tanh或Logistic,其中,ReLU公式:
本发明人工耳蜗听觉场景识别方法通过CNN处理,能识别不同的听觉场景,为语音处理器后续语音增强及言语策略等信号处理模块提供指示,使语音处理器的信号处理与听觉场景更加匹配,输出与实际听觉场景更加相符的刺激信号,提高患者在噪声环境下的语音信号的清晰度、可懂度,同时还可提高音乐场景下的聆听效果,进一步改善人工耳蜗植入患者的生活质量。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海力声特医学科技有限公司,未经上海力声特医学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811276582.0/2.html,转载请声明来源钻瓜专利网。