[发明专利]一种多声源环境下的基于听觉中枢系统的语音分离方法在审

专利信息
申请号: 201410130892.7 申请日: 2014-04-02
公开(公告)号: CN103903632A 公开(公告)日: 2014-07-02
发明(设计)人: 罗元;张毅;胡章芳;童开国;徐晓东 申请(专利权)人: 重庆邮电大学
主分类号: G10L21/0272 分类号: G10L21/0272
代理公司: 重庆市恒信知识产权代理有限公司 50102 代理人: 刘小红
地址: 400065 *** 国省代码: 重庆;85
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明请求保护一种多声源环境下基于听觉中枢系统的语音分离方法,涉及到数字信号处理领域。本发明解决了绝大多数的语音识别方法都只能在低噪声和单声源的环境下使用的局限性,为了能够在多声源的噪声环境下进行语音识别需要首先实现语音分离,本发明基于听觉中枢系统的语音分离方法,外周听见模型完成对语音信号的多频谱分析,重合神经元包括通用突触模型和通用细胞模型,完成对ITD和ILD的信息整合,并且在脑下丘细胞模型中完成语音的分离,实验表明该方法具有较好的鲁棒性。
搜索关键词: 一种 声源 环境 基于 听觉 中枢 系统 语音 分离 方法
【主权项】:
1.一种多声源环境下的基于听觉中枢系统的语音分离方法,其特征在于包括以下步骤: 101、在Matlab平台上建立一个模拟听觉中枢系统的语音分离模型,其中所述语音分离模型包括听觉外周模型和语音提取模型,所述听觉外周模型用于根据N路语音信号的频率进行区分成低频段信号、高频段信号,所述语音提取模型用于对低频段信号、高频段信号的特征参数信息进行提取;所述语音提取模型包括同侧的内侧上橄榄模型MSO、同侧的外侧上橄榄模型LSOi、异侧的外侧上橄榄模型LSOc,然后低频段信号传输给同侧的内侧上橄榄模型MSO,将高频段信号分别传输给MSO、LSOi和LSOc,所述听觉外周模型对语音信号进行预加重、加窗以及分帧预处理,获得各个语音信号语音帧上的时域信号x(n); 102、将步骤101得到的时域信号x(n)通过离散的Fourier变换获得对应的线性频谱其中:e是自然对数的底数,j是虚数单位。n表示语音信号的个数,N表示离散傅里叶变换的次数。0≤n,k≤N-1,并将线性频谱利用Gammatone滤波器组获取Mel频谱;103、将步骤102获得的Mel频谱求对数能量获得对数频谱其中:0≤m<M,Hm(k)表示在语音信号频谱范围内布置的带通滤波器组,并采用离散余弦变换得到Gammatone系数c(n),所述Gammatone系数c(n)加上差分倒谱参数为语音信号的特征参数V;104、建立重合神经元模型,所述重合神经元模型用于对语音信号的双耳时间差ITD和双耳水平差ILD进行空间定位,所述重合神经元模型包括通用突触模型和细胞体模型,所述通用突触模型包括内毛细胞中神经递质的数量q(t)、渗透率k(t),裂隙中神经递质的数量c(t),再生库中神经递质的数量w(t)以及神经发放的概率p(t);所述细胞体模型采用LIF模型,然后将步骤103中的特征参数V输入重合神经元模型完成语音信号的双耳时间差ITD和双耳水平差ILD信 息的加权映射; 105、建立听觉外周反演模型,所述听觉外周反演模型用于对语音信号进行分离;将步骤104中得到的语音信号的双耳时间差ITD和双耳水平差ILD信息的加权映射信息传输给听觉外周反演模型的脑下丘Onset神经细胞模型完成语音信号的分离。 
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410130892.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top