[发明专利]一种多声源环境下的基于听觉中枢系统的语音分离方法在审
申请号: | 201410130892.7 | 申请日: | 2014-04-02 |
公开(公告)号: | CN103903632A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 罗元;张毅;胡章芳;童开国;徐晓东 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明请求保护一种多声源环境下基于听觉中枢系统的语音分离方法,涉及到数字信号处理领域。本发明解决了绝大多数的语音识别方法都只能在低噪声和单声源的环境下使用的局限性,为了能够在多声源的噪声环境下进行语音识别需要首先实现语音分离,本发明基于听觉中枢系统的语音分离方法,外周听见模型完成对语音信号的多频谱分析,重合神经元包括通用突触模型和通用细胞模型,完成对ITD和ILD的信息整合,并且在脑下丘细胞模型中完成语音的分离,实验表明该方法具有较好的鲁棒性。 | ||
搜索关键词: | 一种 声源 环境 基于 听觉 中枢 系统 语音 分离 方法 | ||
【主权项】:
1.一种多声源环境下的基于听觉中枢系统的语音分离方法,其特征在于包括以下步骤: 101、在Matlab平台上建立一个模拟听觉中枢系统的语音分离模型,其中所述语音分离模型包括听觉外周模型和语音提取模型,所述听觉外周模型用于根据N路语音信号的频率进行区分成低频段信号、高频段信号,所述语音提取模型用于对低频段信号、高频段信号的特征参数信息进行提取;所述语音提取模型包括同侧的内侧上橄榄模型MSO、同侧的外侧上橄榄模型LSOi、异侧的外侧上橄榄模型LSOc,然后低频段信号传输给同侧的内侧上橄榄模型MSO,将高频段信号分别传输给MSO、LSOi和LSOc,所述听觉外周模型对语音信号进行预加重、加窗以及分帧预处理,获得各个语音信号语音帧上的时域信号x(n); 102、将步骤101得到的时域信号x(n)通过离散的Fourier变换获得对应的线性频谱
其中:e是自然对数的底数,j是虚数单位。n表示语音信号的个数,N表示离散傅里叶变换的次数。0≤n,k≤N-1,并将线性频谱
利用Gammatone滤波器组获取Mel频谱;103、将步骤102获得的Mel频谱求对数能量获得对数频谱
其中:0≤m<M,Hm(k)表示在语音信号频谱范围内布置的带通滤波器组,并采用离散余弦变换得到Gammatone系数c(n),所述Gammatone系数c(n)加上差分倒谱参数为语音信号的特征参数V;104、建立重合神经元模型,所述重合神经元模型用于对语音信号的双耳时间差ITD和双耳水平差ILD进行空间定位,所述重合神经元模型包括通用突触模型和细胞体模型,所述通用突触模型包括内毛细胞中神经递质的数量q(t)、渗透率k(t),裂隙中神经递质的数量c(t),再生库中神经递质的数量w(t)以及神经发放的概率p(t);所述细胞体模型采用LIF模型,然后将步骤103中的特征参数V输入重合神经元模型完成语音信号的双耳时间差ITD和双耳水平差ILD信 息的加权映射; 105、建立听觉外周反演模型,所述听觉外周反演模型用于对语音信号进行分离;将步骤104中得到的语音信号的双耳时间差ITD和双耳水平差ILD信息的加权映射信息传输给听觉外周反演模型的脑下丘Onset神经细胞模型完成语音信号的分离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410130892.7/,转载请声明来源钻瓜专利网。
- 上一篇:电磁式铁屑清理装置
- 下一篇:一种螺柱焊的焊接工装