[发明专利]音源定向方法及装置和计算机可读存储介质有效
| 申请号: | 201910117064.2 | 申请日: | 2019-02-15 |
| 公开(公告)号: | CN109831731B | 公开(公告)日: | 2020-08-04 |
| 发明(设计)人: | 高威特;叶振昀;张楠赓 | 申请(专利权)人: | 杭州嘉楠耘智信息科技有限公司 |
| 主分类号: | H04R19/04 | 分类号: | H04R19/04 |
| 代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 杨黎峰;钟锦舜 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音源 定向 方法 装置 计算机 可读 存储 介质 | ||
提供一种音源定向方法,包括:获取多个声音输入信号;在多个预设方向中的每个预设方向上计算多个声音输入信号的累加声音信号,并为每个累加声音信号设置定向判断参数,用于判断累加声音信号对应的预设方向是否为声音输入信号的音源方向;计算每个预设方向上的累加声音信号的强度特征值;比较各累加声音信号的强度特征值的大小,根据比较结果更新各累加声音信号的定向判断参数的值;根据各累加声音信号的定向判断参数的值判断各累加声音信号之一对应的预设方向为声音输入信号的音源方向。在该方法中,定向判断参数带有累加声音信号的历史强度信息,避免仅根据声音信号的当前强度进行音源方向判断。还提供相应的音源定向装置及计算机可读存储介质。
技术领域
本发明属于音源定向领域,具体涉及一种音源定向方法及装置以及计算机可读存储介质,用于确定目标声音的音源方向,例如用于确定人声的音源方向。
背景技术
当前的声音定向系统大多基于麦克风阵列来完成音源定向。麦克风阵列是麦克风的集群,包括多个麦克风,可以用于对空间中的声音进行采样和处理,以确定该空间中音源相对于方向特性进行采样和处理。麦克风阵列中通常采用“延时后求和”(delay-and-sum)技术对各麦克风采集的声音信号进行处理。即针对每一个预设音源方向,相对于麦克风阵列中的参考麦克风,将每个麦克风收到的声音信号按照该麦克风在该预设音源方向上相对于参考麦克风的声音传播延时值进行声音信号延时处理,再将各个预设方向上经过延时处理的声音信号以及参考麦克风接收的声音信号进行叠加以获得该预设音源方向上的累加声音信号,接着在得到的这些累加声音信号中找出具有最大振幅的累加声音信号,将该具有最大振幅的累加声音信号所对应的预设方向判断为音源方向。
现有技术中的音源定向通常包括如下两种技术方案:第一种确定音源方向的方案是搜索空间以查找最大能量区域,该方案通常对诸如噪声和混响之类的干扰不具有鲁棒性;第二种确定音源方向的方案是确定声音信号到达不同麦克风的时间差,即,由于麦克风阵列中不同麦克风的位置不同,来自音源的同一声波通常以不同时间到达这些麦克风。
音源定向的一个常见应用场景是确定人声声源的方向。例如在视频会议的过程中,需要确定当前发言者的方位。对此,通常是在多个方向上计算出麦克风阵列采集的多路声音信号在各方向上的累加声音强度,然后将最大声音强度所对应的方向确定为人声声源的方向,并基于确定的人声声源方向,进行声音增强等后续操作。但是上述技术方案存在如下缺陷:由于多个麦克风采集的多路声音信号中存在噪声干扰,所以如果仅仅使用最大声音强度来确定音源方向,往往会将强度较大的噪声识别为目标声音,从而错误地将该噪声的方向作为目标声音的音源方向;另外,由于不能有选择地区分人声和非人声,导致有可能将非人声的其他声音的方向确定为人声方向的情况;再次,当与目标检测声音处于相同或类似频率范围内的其它较大强度声音出现时,例如在有人正常发言时出现第三人意外大声发声或咳嗽等,则会引起错误地将所述其它较大强度声音判断为音源方向。
发明内容
针对上面提到的可能错误地将噪声的方向判定为目标音源方向、将非人声的方向判定为人声方向以及错误地将与目标检测声音处于相同或类似频率范围内的其它较大强度声音判断为音源方向的问题,提出了音源定向方法及装置,其中,定向判断参数在每次进行音源方向判断过程中实时更新以增大或减小,从而该定向判断参数带有相应累加声音信号的历史强度信息,避免了现有技术中仅仅根据声音信号的当前强度信息进行音源方向判断的缺点,为音源定向判断提供了缓冲机制,从而避免了其它突发声音对音源方向判断的影响,使得能够避免噪声的干扰,环境适应性强,而且能够有选择地对特定声音例如人声进行音源定向,进一步排除其他非人声信号的干扰,另外也能够避免与目标检测声音处于相同或类似频率范围内的其它较大强度声音的干扰,而且实现简单,不涉及频域计算,功耗低,配置灵活。
依据本发明的第一方面,提供了一种音源定向方法,其包括:
获取多个声音输入信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州嘉楠耘智信息科技有限公司,未经杭州嘉楠耘智信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910117064.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:MEMS麦克风制造方法
- 下一篇:基于智能手机的智能啸叫抑制装置和方法





