[发明专利]估算混响分量的计算方法及装置有效

申请号：	201710578807.7	申请日：	2017-07-14
公开（公告）号：	CN107360497B	公开（公告）日：	2020-09-29
发明（设计）人：	蔡钢林	申请（专利权）人：	深圳永顺智信息科技有限公司
主分类号：	H04R3/00	分类号：	H04R3/00
代理公司：	深圳市明日今典知识产权代理事务所(普通合伙) 44343	代理人：	王杰辉
地址：	518000 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	估算混响分量计算方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提出的一种估算混响分量的计算方法及装置，构建了预测误差向量，使其与语音数据进行结合，求出预测混响分量，再对所述预测混响分量进行平滑处理，获得估算混响分量。获得的估算混响分量可用于计算混响功率谱密度，进而根据维纳滤波原理，将采集到的语音信号中的混响分量滤去，提高了采集的语音数据的质量。

技术领域

本发明涉及到语音识别领域，特别是涉及到一种估算混响分量的计算方法及装置。

背景技术

近年来随着互联网技术、智能硬件的蓬勃发展，语音识别、声纹识别、声源检测等语音智能交互技术开始从实验室走向用户。由于语音识别技术是基于语音的人机交互系统最核心的技术。目前在限定条件下识别率已经达到可用的准确率。所谓限定调节通常是指用户距离麦克风较近，噪声干扰较小。而必须近距离发出语音指令这一条件限制了语音交互的便捷性。

在远讲情况下，由于语音能量会快速衰减，而噪音干扰能量大致不变，会使得识别率迅速下降。另外一个影响识别准确率的因素是，语音指令到达房间墙壁多次反射之后的混响，也会造成实际应用与语音识别训练数据集的不匹配，影响识别率。

噪音主要有两个来源：(1)麦克风信号采集系统自带的信道噪声，信道噪声因麦克风的敏感性而不同，麦克风敏感性越高，通常信道噪声越高；(2)不可忽略的环境噪声干扰，比如电视机、空调噪声等等。相比于噪声，混响由于产生条件更为复杂，更难抑制。并且，噪音和混响一般同时存在，使得混响抑制更加困难。

CN201280047068公开了一种混响抑制装置，具备：回声消除部，去除输入信号中包含的回声分量；啸声抑制部，根据被去除了回声分量的输入信号的频率特性，检测啸声的发生，使所检测出的啸声分量的频率的电平衰减；以及语头抑制部，检测啸声分量的频率电平被衰减的输入信号的声音区间，抑制所检测出的声音区间的声音开始部分的信号值。

然而，该装置提供的是汽车内部空间的混响抑制解决方法，并不适用于家居音频采集时的混响问题。而解决家居音频采集时的混响问题，需要预判声音信号中的混响分量。

发明内容

本发明的主要目的为提供一种估算混响分量的计算方法及装置，旨在辅助解决家居环境中声音采集的混响问题。

本发明提出一种基于深度神经网络的特定声源检测方法，包括以下步骤：

构建预测误差向量；

根据所述预测误差向量，结合混合语音频谱及估算语音频谱，计算当前帧的预测混响分量E_Pre和前一帧的预测混响分量E_Pre，o；

求取估算混响分量，所述估算混响分量由以下式子求得：

E(k)＝η|E_Pre|²-(1-η)|E_Pre，o|²

其中，η为平滑系数。

优选地，所述前一帧的预测混响分量E_Pre，o，由以下式子求得：

其中，Y(l-1,k)为前一帧的混合语音频谱，为估算语音频谱的转置矩阵；G^k为所述预测误差向量。

优选地，所述η的取值范围为[0.6，0.75)、0.75或(0.75，0.9]。