[发明专利]一种多声源环境下的基于听觉中枢系统的语音分离方法在审
申请号: | 201410130892.7 | 申请日: | 2014-04-02 |
公开(公告)号: | CN103903632A | 公开(公告)日: | 2014-07-02 |
发明(设计)人: | 罗元;张毅;胡章芳;童开国;徐晓东 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声源 环境 基于 听觉 中枢 系统 语音 分离 方法 | ||
技术领域
本发明属于人工智能领域,具体涉及多声源环境下基于听觉中枢系统的语音分离方法。
背景技术
当前,多声源环境下语音分离的技术大概有以下三种:计算听觉场景分析、独立变量分析以及基于听觉中枢系统的语音分离。
独立分量分析的实现要先对语音信号的混合方式以及统计特征进行一种理性化的设想:时域情况下混合的语音信号必须满足标准对齐,初始语音信号必须满足统计相互独立并且最多有且只有一个是高斯信号,多个混合的语音信号必须比初始的语音信号数目要多,显然在现实环境中上述要求很难全部符合。
由于独立分量分析出现假设这些问题难以满足,因此发展了能够不会受到这些限制的计算听觉场景分析的语音信号分离技术。该方法将语音分离过程归纳为将语音信号分量进行规则性的组织:把混合语音流中出自同一个声源的语音信号分量组织到同一语音分流中。这种方法主要是利用谐波的计算听觉场景分析系统能够获得良好的语音分离结果,然而在进行特征提取与线索组织的阶段很复杂,在计算机处理时难以实现。本发明利用人耳听觉特性实现在多声源环境下的语音分离,具有很强的实际意义。
在过去的二十五年,对听觉中枢系统的结构和功能的研究已经有了长足的进步,研究表明脑下丘在听觉信息的感知过程中起到了非常关键的作用。脑下丘是来自背侧耳蜗核的纵向听觉分离信息与来自上橄榄核的横向听觉定位信息最先整合的部位,在声音从外耳向上传递到大脑的过程中,脑下丘是最主要的处理站,它被看作是从不同的脑干区域中提取声音分离特征的一个枢纽。在这里,把从语音信号中提取出来的包括双耳时间差以及双耳水平差在内的各个特征信息都加以整合处理。
经过生物学家研究表明,在脑下丘中存在的代表不同声音频谱的神经细胞排列:有些细胞对应低频段的窄波段,有些细胞对应高频段的宽波段,而还有些细胞只响应频谱凹槽,进而用于在垂直平面上声音分离。
脑下丘的神经组织中的一个特别重要的特点是在物理上使用多层解剖结构对声音信号依照频率进行分解,每一层的神经细胞只对特定的频率分量进行响应,这种解剖特征被称之为频率解剖特征。这种特征使得多频段声音输入在脑下丘中进行了空间隔离。此外,脑下丘还针对声源的位置用不同的神经细胞代表不同的声源。这样,来自同一声源或者具有同样频率特征的声音就很容易被重新组合和提取出来。嘈杂的多声源环境下,有意义的语音信号就被分离提取出来重新生成信号流。
脑下丘在语音分离中有着非常关键的作用,如图1所示,脑下丘会控制内耳神经的听觉纤毛响应阈值,低频段(<1.5kHz)的语音信号(在这个频段范围内双耳时间差(ITD)对语音分离更有效率)会经过内侧上橄榄(Medial superiorolive,MSO)的中区传递给脑下丘;高频段(>1.5kHz)的语音信号(在这个频段范围内双耳水平差(ILD)对语音分离更有效率)则可以同时经过内侧上橄榄(MSO)和外侧上橄榄(Lateral superior olive,LSO)的中区传递给脑下丘,最后不同区域的信号分别输入脑下丘。
综上所述,脑下丘对多声源的噪声输入能够有效地进行声音特征提取和分离,如果能够建立一个以脑下丘为核心的听觉中枢系统模型,就能实现在多声源环境下基于听觉中枢系统的语音分离问题。
基于以上的研究结果,本发明首先建立了外周听觉模型实现对语音信号进行多频谱分析,接着建立重合神经元模型提取语音信号的特征,最后对脑下丘中的起始神经细胞(Onset Cell)进行建模并且完成语音的分离。这种神经细胞通过对不同声源的不同位置加以区别,并且通过重合神经元模型提取语音信号的特征,来实现同一声源被重新组合和提取出来,实现语音分离。
发明内容
针对以上现有技术中的不足,本发明的目的在于提供一种实现了在多声源环境下基于听觉中枢系统的语音分离问题,提高了分离的精度,扩大了语音分离的范围的语音分离方法。本发明的技术方案如下:一种多声源环境下的基于听觉中枢系统的语音分离方法,其包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410130892.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电磁式铁屑清理装置
- 下一篇:一种螺柱焊的焊接工装