[发明专利]音频处理装置、方法和计算机可读记录介质有效
| 申请号: | 201580053837.5 | 申请日: | 2015-09-28 | 
| 公开(公告)号: | CN106797526B | 公开(公告)日: | 2019-07-12 | 
| 发明(设计)人: | 光藤祐基 | 申请(专利权)人: | 索尼公司 | 
| 主分类号: | H04S5/02 | 分类号: | H04S5/02;G01S3/808;H04R1/40;H04R3/00 | 
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;陈炜 | 
| 地址: | 日本*** | 国省代码: | 日本;JP | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 音频 处理 装置 方法 程序 | ||
本技术涉及能够以较低的成本改善对声像的定位的音频处理装置、方法和计算机可读记录介质。麦克风阵列收集来自声源的声音平面波。驱动信号生成单元根据通过麦克风阵列的声音收集所获得的收集的声音信号的空间频谱来生成空间域中的扬声器驱动信号。方位信息获得单元获得指示讲话的人的方位的讲话人方位信息。空间滤波器应用单元使用通过讲话人方位信息所限定的空间滤波器对扬声器驱动信号执行滤波,从而减少空间混叠。本技术适用于空间混叠控制器。
技术领域
本技术涉及音频处理装置和方法以及程序,并且特别地涉及能够以较低的成本来改善对音像的定位的音频处理装置和方法以及程序。
背景技术
存在用于利用平面扬声器阵列或线性扬声器阵列来再现声场的常规已知的波前合成技术。这样的波前合成技术可以用于例如图1中所示的下一代双向通信等。
在图1中,在其中存在谈话者W11的空间P11与其中存在谈话者W12的空间P12之间进行下一代双向通信。
具体地,在空间P11中,由主要由谈话者W11发出的音频构成的声场A通过由如所示的配置有多个纵向布置的麦克风的线性麦克风阵列MCA11来拾取,并且所产生的声源信号被传输至空间P12。
在示例中,所示的箭头指示作为声源的谈话者W11的音频传播的方向,并且谈话者W11的音频以从线性麦克风阵列MCA11所视的角度θ到达并且被拾取。在下文中,角度θ或音频从声源传播的方向与配置麦克风阵列的麦克风被布置的方向之间所形成的角度将被表示为到达角θ。
在空间P12中,根据从空间P11传输的声源信号来生成用于再现声场A的扬声器驱动信号。然后,如所示的在空间P12中,基于由配置有多个纵向布置的扬声器的线性扬声器阵列SPA11生成的扬声器驱动信号来再现声场A。
在示例中,所示的箭头指示从线性扬声器阵列SPA11输出并且被方位至谈话者W12的音频传播的方向。该传播方向与线性扬声器阵列SPA11之间所形成的角度与到达角θ相同。
附带地,虽然此处未示出,但是在空间P12中也设置了线性麦克风阵列,配置有主要由谈话者W12发出的音频的声场B通过该线性麦克风阵列来拾取并且所产生的声源信号被传输至空间P11。另外,在空间P11中,根据从空间P12传输的声源信号来生成扬声器驱动信号并且由线性扬声器阵列(未示出)基于所产生的扬声器驱动信号来再现声场B。
附带地,当以此方式利用麦克风阵列或扬声器阵列来再现声场时,需要布置无限多个的扬声器和麦克风以便以物理准确的方式来再现声场。例如,当扬声器或麦克风被离散地布置为如图1中所示的示例中时,产生空间混叠。
通过配置扬声器阵列的扬声器的间隔或配置麦克风阵列的麦克风的间隔所计算的较低空间奈奎斯特频率来确定不被空间混叠所干扰的最高空间频率(其在下文将被表示为上限空间频率)klim。
也就是说,将麦克风的间隔设为dmic并且将扬声器的间隔设为dspk,在以下等式(1)中得到上限空间频率klim。
[数学公式1]
如此获取的上限空间频率klim对声像的定位有影响,并且优选地一般取较高的值。
另外,声源的频率(其在下文将被表示为时间频率)f与空间频率k之间的关系如以下等式(2)所示。注意,c在等式(2)中指示声速。
[数学公式2]
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580053837.5/2.html,转载请声明来源钻瓜专利网。





