[发明专利]音频信号处理设备、方法和电子设备在审
申请号: | 201611233909.7 | 申请日: | 2016-12-28 |
公开(公告)号: | CN106782584A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 徐荣强 | 申请(专利权)人: | 北京地平线信息技术有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216 |
代理公司: | 北京市正见永申律师事务所11497 | 代理人: | 黄小临,王怀章 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 设备 方法 电子设备 | ||
技术领域
本申请涉及音频技术领域,且更具体地,涉及一种音频信号处理设备、音频信号处理方法、电子设备、计算机程序产品和计算机可读存储介质。
背景技术
无论是智能化的语音识别系统(例如,智能家电、机器人等),还是传统的语音通信系统(例如,会议系统、因特网协议传送话音VoIP系统等),都会遇到回声抵消的问题。
例如,在单讲模式下:在智能设备应用场景中,设备不希望自己所播放的内容中包括的唤醒词或识别词再次进入自己的识别系统从而造成误报,影响体验和浪费资源;在传统通信系统中,远端用户不希望听到自己说话的回音。在双讲模式下:在智能设备应用场景中,希望设备可以听到用户说话的声音,但不被自己播放的内容所干扰;在传统通信系统中,希望即使近端和远端用户同时说话,也能够保证清晰的通信质量和较高的可懂度。以上都是在语音体验中非常重要的场景,也是当今音频信号处理中的难题。
目前现有的回声消除技术是基于单麦克风和回声抑制算法的结合。回声抑制算法仅仅从时域和频域的角度来处理输入信号,使得在处理回声的时候也会同时损伤语音,从而影响后续的识别率。并且,在存在大回声的情况下,就会面临要么回声处理不干净而影响识别率,要么算法抑制过强而损伤语音成分,二者都会影响识别效果。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种音频信号处理设备、音频信号处理方法、电子设备、计算机程序产品和计算机可读存储介质,其可以利用指向麦克风阵列的特性来实现无损的关注信号增强和回声信号抑制。
根据本申请的一个方面,提供了一种音频信号处理设备,所述设备包括:扬声器;麦克风阵列,包括具有不同拾音区的多个指向麦克风,每个指向麦克风用于在自身的拾音区内采集分路输入信号,所述分路输入信号包括来自信号源的关注信号分量和来自所述扬声器的回声信号分量;复用器,与每个指向麦克风电连接,用于将每个指向麦克风所采集的分路输入信号合并为总输入信号;声源定位器件,用于确定所述信号源的位置和所述扬声器的位置;以及增益控制器件,与所述声源定位器件和每个指向麦克风电连接,用于根据所述信号源的位置和所述扬声器的位置来调整每个指向麦克风的增益,以使得在所述总输入信号中从所述信号源接收到的关注信号分量的功率与从所述扬声器接收到的回声信号分量的功率之间的信回比最大。
在本申请的一个实施例中,所述声源定位器件包括:信号源定位器件,用于检测在当前场景中是否存在正在输出关注信号的信号源、所述信号源的数量及其相应位置;以及扬声器定位器件,用于检测在所述当前场景中是否存在正在播放声音信号的扬声器、所述扬声器的数量及其相应位置。
在本申请的一个实施例中,所述信号源定位器件包括:摄像头,用于捕捉所述当前场景的场景图像;以及图像识别单元,用于在所述场景图像中识别所述信号源,确定所述信号源的数量,并且确定所述信号源与所述音频信号处理设备的基准位置之间的相对位置。
在本申请的一个实施例中,所述图像识别单元根据所述信号源在所述场景图像中的位置来确定所述信号源与所述信号源定位器件的基准位置之间的相对位置,并且根据所述信号源定位器件的基准位置与所述音频信号处理设备的基准位置之间的配准关系来确定所述信号源与所述音频信号处理设备的基准位置之间的相对位置。
在本申请的一个实施例中,所述信号源定位器件包括:信号分离单元,用于接收由至少两个指向麦克风所采集的至少两路分路输入信号,并且从所述至少两路分路输入信号中分离来自所述信号源的关注信号分量;以及声音识别单元,用于根据分离出的所述信号源的关注信号分量的相位来确定所述信号源与所述音频信号处理设备的相对位置。
在本申请的一个实施例中,所述扬声器定位器件包括:信号分离单元,用于接收由至少两个指向麦克风所采集的至少两路分路输入信号,并且从所述至少两路分路输入信号中分离来自所述扬声器的关注信号分量;以及声音识别单元,用于根据分离出的所述扬声器的关注信号分量的相位来确定所述扬声器与所述音频信号处理设备的相对位置。
在本申请的一个实施例中,所述增益控制器件包括:比较单元,用于响应于存在正在输出关注信号的一个或多个信号源且不存在正在播放声音信号的扬声器,比较所述一个或多个信号源与每个指向麦克风的拾音区之间的第一位置关系;以及增益调整单元,用于根据所述第一位置关系来调整每个指向麦克风的增益,以使得在所述总输入信号中从所述一个或多个信号源接收到的关注信号分量的功率最大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线信息技术有限公司,未经北京地平线信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611233909.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于核范数的鲁棒音阶轮廓特征提取算法
- 下一篇:一种音频信号处理方法及装置