[发明专利]一种基于计算听觉场景分析的单通道语音盲分离方法有效
| 申请号: | 201310384413.X | 申请日: | 2013-08-29 |
| 公开(公告)号: | CN103456312A | 公开(公告)日: | 2013-12-18 |
| 发明(设计)人: | 李鸿燕;贾海蓉;张雪英;任光龙;屈俊玲 | 申请(专利权)人: | 太原理工大学 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
| 代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 董芙蓉 |
| 地址: | 030024 山西省太原*** | 国省代码: | 山西;14 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 计算 听觉 场景 分析 通道 语音 分离 方法 | ||
技术领域
本发明涉及一种基于计算听觉场景分析的单通道语音盲分离方法,属于语音信号处理领域。
背景技术
语音信号处理是近年来信号处理中最引人注目的研究领域之一,在语音信号处理领域,一个重要的问题是如何从未知信号随机混合得到的混叠语音中分离出原始语音,混叠语音分离在噪声消除、语音合成、语音通信等方面有重要的研究意义和实用价值。由于混叠语音在时域和频域的重叠性,常用的语音增强方法难以实现语音分离。目前,混叠语音分离最常采用的方法是盲源分离方法即独立分量分析方法,但独立分量分析方法有一些假设条件,例如要求观测信号的个数大于或等于源信号的个数、假定没有噪声等,这些条件限制了盲源分离的应用,因此,盲源分离不能应用于源信号个数大于观测信号个数的单通道混叠语音分离问题,尤其是在噪声存在的情况下,盲源分离方法应用于混叠语音分离效果明显恶化。
人工智能领域的发展需要新一代计算机的人机接口能自如地用语言和人类交流。语音和人类的听觉系统是密切相关的,在研究语音信号本身的特性及其处理方法的同时,研究人类听觉系统感知语音信息的机理将能进一步促进语音信号处理的研究。事实上,人类听觉系统对语音信号的感知能力大大地超过了目前的信号处理水平,由于人的听觉系统是一个很强大的音频信号处理器,特别是在强噪声干扰下,人类能有选择地听取所需的内容,能够从杂乱的声音信号中分辨并跟踪其感兴趣的某一路目标信号,感知其相关信息,即所谓的“鸡尾酒会效应”。利用听觉感知的研究成果建立模型,并用计算机来实现它,使听觉场景分析应用到机器智能中,让机器具有智能的听觉,这就是计算听觉场景分析。用计算听觉场景分析方法进行混叠语音信号分离,不仅符合人的感知特性,而且不受盲源分离方法的那些假设条件限制。计算听觉场景分析从心理模型的角度,把听觉组织过程看作是一个具有层次性的加工过程,丰富了听觉组织的理论,听觉场景分析还用生态学的观点来分析听觉组织过程,从而增加了理论的外部效应,使之更加易于实际应用。计算听觉场景分析由于其不需要假设信号的统计特性和单通道条件下的可实现性,所以特别适合应用于噪声存在时的单通道混叠语音分离问题。
发明内容
本发明的目的是克服现有技术的缺点,解决如何从存在噪声的单通道混叠语音中分离出目标语音的方法,提出一种基于能量和谐波特性的计算听觉场景分析单通道混叠语音分离方法。
本发明提出一种基于计算听觉场景分析的单通道语音盲分离方法,其特征在于:
所述方法包括如下步骤:
步骤一、对输入的混叠语音进行前端处理;
步骤二、对经过步骤一处理的混叠语音进行听觉特征提取;
步骤三、对经过步骤二处理的混叠语音基于谐波特性进行听觉分割;
步骤四、对经过步骤三处理的混叠语音基于能量特征进行听觉重组;
步骤五、对经过步骤四处理的混叠语音进行目标语音重构。
进一步地,步骤一中:所述前端处理是将输入的混合时域信号转化成相应的时频域表示形式;根据人耳的感知机理,将输入混合声音信号通过128个信道的Gammatone滤波器组进行带通滤波,该滤波器的中心频率按照等距宽(Equivalent Rectangular Bandwidth,ERB)在80~5kHz之间准对数分布;将时频分解后的每一个Gammatone滤波器的输出送入Meddis内耳毛细胞模型;得到神经发放率;然后,在时域上对每个毛细胞的输出以帧长20ms,50%重叠为帧移进行分帧处理;将输入的混合语音信号分解成为一系列时频单元,即T-F单元;同时,为了高频部分的特征提取和听觉重组,对毛细胞输出进行半波整流和低通滤波,从而得到每个通道的包络特征。
进一步地,步骤二中:经过前端处理过程,混合语音信号在时域和频域上被分解成一系列的T-F单元,在每个T-F单元中,计算下列特征函数:自相关函数(AH)、包络自相关函数(AE)、主基音周期(P(m))、相邻信道互相关(CH)、相邻信道包络互相关(CE),式(4)、式(5)、式(6)、式(7、式(8)为其计算公式:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310384413.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:抗干扰变频器电缆
- 下一篇:一种具有隔热功能的五层复合吸声材料





