[发明专利]信号处理设备和方法以及程序有效
申请号: | 201880071368.3 | 申请日: | 2018-10-31 |
公开(公告)号: | CN111316671B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 辻实;知念徹;畠中光行 | 申请(专利权)人: | 索尼公司 |
主分类号: | H04S7/00 | 分类号: | H04S7/00;G10L19/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴孟秋 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 处理 设备 方法 以及 程序 | ||
本技术涉及可以容易地确定声像的定位位置的信号处理设备、信号处理方法以及程序。该信号处理设备设置有:获取单元,被配置为获取与在显示从收听位置观看到的收听空间的状态下指定的收听空间中的音频对象的声像的定位位置相关的信息;以及生成单元,被配置为基于与定位位置相关的信息生成比特流。本技术可以应用于信号处理设备。
技术领域
本技术涉及信号处理设备和方法以及程序,更具体地,涉及可以容易地确定声像的定位位置的信号处理设备和方法以及程序。
背景技术
近年来,基于对象的音频技术引起了人们的关注。
在基于对象的音频中,对象音频数据包括相对于音频对象的波形信号和指示音频对象的定位信息的元信息,该音频对象的定位信息由距作为预定参考的收听位置的相对位置表示。
然后,基于元信息,通过例如基于矢量的幅度平移(VBAP)将音频对象的波形信号渲染为期望数量的声道的信号,并进行再现(例如,参见非专利文献1和2)。
在基于对象的音频中,可以在创建音频内容时在三维空间上沿各个方向布置音频对象。
例如,在用于Tools的Dolby Atoms Panner插件(参见例如非专利文献3)中,可以在3D图形的用户界面上指定音频对象的位置。利用该技术,通过将在用户界面上显示的虚拟空间的图像上的位置指定为音频对象的位置,可以在三维空间上沿任意方向定位音频对象的声音的声像。
另一方面,相对于传统双声道立体声的声像的定位通过称为平移(panning)的技术来调整。例如,通过经由用户界面(UI)改变预定音轨相对于左右双声道的比例比来确定声像要定位在左右方向上的位置。
现有技术文献
专利文献
非专利文献1:ISO/IEC 23008-3Information technology-High efficiencycoding and media delivery in heterogeneous environments-Part 3:3D audio
非专利文献2:Ville Pulkki,“Virtual Sound Source Positioning UsingVector Base AmPLitude Panning”,Journal of AES,Vol.45,No.6,PP.456-466,1997
非专利文献3:Dolby Laboratories,Inc.,“Authoring for Dolby Atmos(R)Cinema Sound Manual”,[在线],[2017年10月31日检索],互联网httPs://www.dolby.com/us/en/technologies/dolby-atmos/authoring-for-dolby-atmos-cinema-sound-manual.Pdf
发明内容
本发明要解决的问题
然而,利用前述技术,难以容易地确定声像的定位位置。
即,在基于对象的音频和双声道立体声的任一种情况下,音频内容的创建者不能直观地指定声像相对于内容的声音的实际收听位置的定位位置。
例如,利用Pro Tools的Dolby Atoms Panner插件,三维空间上的任何位置都可以指定为声像的定位位置。但当从实际收听位置观看指定的位置时,却无法知道声像的定位位置所在位置。
同样,当在双声道立体声的情况下指定比例比时,也难以直观地掌握比例比与声像的定位位置之间的关系。
因此,创建者反复调整声像的定位位置,并在该定位位置处收听声音,以确定最终的定位位置。因此,需要一种经验感来减少这种定位位置调整的次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880071368.3/2.html,转载请声明来源钻瓜专利网。