[发明专利]编码设备和方法、解码设备和方法、以及程序在审
| 申请号: | 202080083336.2 | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN114762041A | 公开(公告)日: | 2022-07-15 |
| 发明(设计)人: | 辻实;知念徹 | 申请(专利权)人: | 索尼集团公司 |
| 主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/00;H04S7/00 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 编码 设备 方法 解码 以及 程序 | ||
本技术涉及能够基于内容创建者的意图实现距离感测控制的编码设备和方法、解码设备和方法、以及程序。该编码设备包括:对象编码单元,对对象的音频数据进行编码;元数据编码单元,对包括对象的位置信息的元数据进行编码;距离感测控制信息确定单元,确定用于音频数据的距离感测控制的距离感测控制信息;距离感测控制信息编码单元,对距离感测控制信息进行编码;多路复用单元,多路复用编码的音频数据、编码的元数据和编码的距离感测控制信息并生成编码数据。本技术可应用于内容再现系统。
技术领域
本技术涉及编码设备和方法、解码设备和方法、以及程序,并且更具体地,涉及能够基于内容创建者的意图实现距离感测控制的编码设备和方法、解码设备和方法、以及程序。
背景技术
近年来,基于对象的音频技术已经引起关注。
在基于对象的音频中,对象音频的数据由关于音频对象的波形信号和指示由与用作预定参考的收听位置的相对位置表示的音频对象的定位信息的元数据配置。
然后,基于元数据通过例如基于矢量的振幅平移(VBAP)将音频对象的波形信号渲染成期望数量的声道的信号并且再现(参见,例如,非专利文献1和非专利文献2)。
此外,作为与基于对象的音频相关的技术,例如,还提出了用于以用户可以指定任意收听位置的更高自由度实现音频再现的技术(例如,参见专利文献1)。
在该技术中,根据收听位置校正音频对象的位置信息,并且根据从收听位置到音频对象的距离的改变执行增益控制或滤波处理,使得伴随用户的收听位置的改变的频率特性或音量的改变(即,到音频对象的距离的感觉)被再现。
引用列表
非专利文献
非专利文献1:ISO/IEC 23008-3Information technology-High efficiencycoding and media delivery in heterogeneous environments-Part 3:3D audio
非专利文献2:Ville Pulkki,“Virtual Sound Source Positioning UsingVector Base Amplitude Panning”,Journal of AES,vol.45,no.6,pp.456-466,1997
专利文献
专利文献1:WO 2015107926 A
发明内容
本发明要解决的问题
然而,在上述技术中,用于再现对应于从收听位置到音频对象的距离的频率特性和音量的变化的增益控制和滤波处理是预定的。
因此,当内容创建者期望基于与频率特性和音量的变化不同的方式再现距离感时,不能再现这种距离感。即,不可能实现基于内容创建者的意图的距离感测控制。
鉴于这种情况做出了本技术,并且其目的是基于内容创建者的意图实现距离感控制。
问题的解决方案
根据本技术的第一方面的编码装置包括:对象编码单元,对对象的音频数据进行编码;元数据编码单元,对包括对象的位置信息的元数据进行编码;距离感测控制信息确定单元,确定用于对音频数据执行的距离感测控制处理的距离感测控制信息;距离感测控制信息编码单元,对距离感测控制信息进行编码;以及多路复用器,其多路复用编码的音频数据、编码的元数据和编码的距离感测控制信息以生成编码数据。
根据本技术的第一方面的编码方法或程序包括以下步骤:对对象的音频数据进行编码;对包括对象的位置信息的元数据进行编码;确定用于对所述音频数据执行的距离感测控制处理的距离感测控制信息;对所述距离感测控制信息进行编码;并且
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼集团公司,未经索尼集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080083336.2/2.html,转载请声明来源钻瓜专利网。





