[发明专利]应用于远场识别的前处理方法和装置有效

申请号：	201510236032.6	申请日：	2015-05-11
公开（公告）号：	CN104810021B	公开（公告）日：	2017-08-18
发明（设计）人：	魏建强;崔玮玮;宋辉;王昕;姜俊	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L17/02
代理公司：	北京清亦华知识产权代理事务所(普通合伙)11201	代理人：	宋合成
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	应用于识别处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及数据处理技术领域，尤其涉及一种应用于远场识别的前处理方法和装置。

背景技术

远场识别技术,也即远距离识别技术，通常是为了解决说话人距离语音设备2米之外场景的语音识别请求。为了获取比较稳定可靠的远场识别性能，针对远场识别场景的前处理(远场拾音)技术就显得尤为迫切和重要。

现有技术中，远场拾音的流程串联依次包括：声回波消除(Acoustic echo cancellation，AEC)，声源定位，自适应波束形成(Adaptive Beamforming，ABF)，单麦增强和后处理。

但是，现有技术中需要声源定位模块，声源定位模块本身准确度就不理想，而且与后续的ABF串联，还会影响ABF的性能，从而影响前处理效果，另外，先进行AEC，当要处理的声音信号的数量较大时，运算量也较大。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的一个目的在于提出一种应用于远场识别的前处理方法，该方法可以提高前处理效果，并且可选的，在声音信号数量较大时可以降低运算量。

本发明的另一个目的在于提出一种应用于远场识别的前处理装置。

为达到上述目的，本发明第一方面实施例提出的应用于远场识别的前处理方法，包括：对要处理的声音信号进行固定波束形成处理，得到固定波束形成处理后的波束信号；对所述固定波束形成处理后的波束信号，进行声回波消除以及最优波束选择；根据声回波消除以及最优波束选择后的波束信号，得到应用于远场识别的前处理后的信号。

本发明第一方面实施例提出的应用于远场识别的前处理方法，不需要声源定位模块，可以避免声源定位不准确造成的前处理效果不好的问题，从而可以提高前处理效果，并且，可选的，先进行FBF后再进行AEC，由于通常FBF后的波束数量相对于要处理的声音信号的数量小，可以降低运算量。

为达到上述目的，本发明第二方面实施例提出的应用于远场识别的前处理装置，包括：固定波束形成模块，用于对要处理的声音信号进行固定波束形成处理，得到固定波束形成处理后的波束信号；处理模块，用于对所述固定波束形成处理后的波束信号，进行声回波消除以及最优波束选择；获取模块，用于根据声回波消除以及最优波束选择后的波束信号，得到应用于远场识别的前处理后的信号。

本发明第二方面实施例提出的应用于远场识别的前处理装置，不需要声源定位模块，可以避免声源定位不准确造成的前处理效果不好的问题，从而可以提高前处理效果，并且，可选的，先进行FBF后再进行AEC，由于通常FBF后的波束数量相对于要处理的声音信号的数量小，可以降低运算量。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明一实施例提出的应用于远场识别的前处理方法的流程示意图；

图2是本发明另一实施例提出的应用于远场识别的前处理方法的流程示意图；

图3是本发明另一实施例提出的应用于远场识别的前处理方法的流程示意图；

图4是本发明另一实施例提出的应用于远场识别的前处理装置的结构示意图；

图5是本发明另一实施例提出的应用于远场识别的前处理装置的结构示意图；

图6是本发明另一实施例提出的应用于远场识别的前处理装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

图1是本发明一实施例提出的应用于远场识别的前处理方法的流程示意图，该方法包括：

S11：对要处理的声音信号进行固定波束形成处理，得到固定波束形成处理后的波束信号。

其中，要处理的声音信号可以是指麦克风信号，麦克风信号指麦克风拾取到的信号，其中包括近端语音信号(语音控制指令)，房间混响和各种环境噪音等。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510236032.6/2.html，转载请声明来源钻瓜专利网。

上一篇：抑制跳模的影响的热辅助磁记录头
下一篇：语音转化装置、方法及使用该装置的支持文本存储的音箱

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]应用于远场识别的前处理方法和装置有效

专利文献下载