[发明专利]视频的处理方法、装置、设备和计算机存储介质在审
申请号: | 201710539393.7 | 申请日: | 2017-07-04 |
公开(公告)号: | CN109218821A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 尹海斌 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04N21/4402 | 分类号: | H04N21/4402;H04N21/44;G06T15/20 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 孟繁琦 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型信息 视频 视频转码 计算机存储介质 补充增强信息 网络抽象层 模型重建 携带 发送端 接收端 解析 发送 渲染 播放 传递 | ||
本发明提供了一种视频的处理方法、装置、设备和计算机存储介质,其中方法包括:将视频转码所采用的模型信息携带在网络抽象层(NAL)单元的补充增强信息(SEI)中;发送所述NAL单元。以及,接收视频的NAL单元;从所述NAL单元的SEI中解析所述视频转码所采用的模型信息。本发明通过将视频转码所采用的模型信息携带在SEI中的方式,实现模型信息从视频的发送端到接收端的传递,使得视频的接收端能够依据SEI中的模型信息正确地进行模型重建,进而进行视频的渲染播放。
【技术领域】
本发明涉及计算机应用技术领域的视频处理技术,特别涉及一种视频的处理方法、装置、设备和计算机存储介质。
【背景技术】
全景视频的压缩技术已经成为虚拟现实(VR,Virtual Reality)技术领域的研究重点,全景视频通常在视频转码时,需要全景视频映射展开为平面图像,映射展开过程中可能采用不同的模型,例如Equirectangular(等距长方圆柱投影)模型、CubeMap(立方图投影)模型、Pyramid(金字塔投影)模型、Pyramid变种模型等等。其中一些模型是码率无差别分配的模型,例如Equirectangular模型和CubeMap模型,这些模型在全景视频的展开平面上均匀分配码率。而另一些模型是基于视角的码率分配模型,例如Pyramid模型和Pyramid变种模型,这些模型会将全景视频分成多路视频,使得每一路映射的视频在特定视角上具有高清晰度,即码率在特定视角上集中分配。
相应地,全景视频的接收端在对接收到的视频数据进行解码后,需要获知全景视频发送端在视频转码过程中采用的模型,如果是基于视角的码率分配模型,则需要进一步获知视角信息,据此进行模型重建,然后进行视频的三维渲染。一旦全景视频的接收端采用了错误的模型进行重建,则会造成视频渲染失败而无法正常播放,因此,由于视频转码过程中所采用模型的多样性和相同模型的多视角特性,如何实现模型信息的传递成为亟待解决的问题。
【发明内容】
有鉴于此,本发明提供了一种视频的处理方法、装置、设备和计算机存储介质,以便于实现模型信息的传递,使得视频的接收端能够正确地进行模型重建。
具体技术方案如下:
本发明提供了一种视频的处理方法,该方法包括:
将视频转码所采用的模型信息携带在网络抽象层NAL单元的补充增强信息SEI中;
发送所述NAL单元。
根据本发明一优选实施方式,所述模型信息包括:
模型类型信息;或者,
模型类型信息和模型的视角信息。
根据本发明一优选实施方式,所述模型信息还包括:是否包含视角信息的指示信息。
根据本发明一优选实施方式,所述模型的视角信息包括:
模型的视角在视角表中的索引信息。
根据本发明一优选实施方式,所述模型的视角信息包括:
视角表示方式信息、所述模型的视角信息的长度信息以及具体的视角信息。
根据本发明一优选实施方式,所述视角表示方式包括:
欧拉角、四元数或旋转矩阵。
根据本发明一优选实施方式,若采用欧拉角的视角表示方式,则对应的具体的视角信息包括:欧拉角的量化信息,所述量化信息为以5度为单位的量化值。
根据本发明一优选实施方式,若采用四元数的视角表示方式,则对应的具体的视角信息包括:旋转轴信息和对应旋转角的量化信息,所述量化信息为以5度为单位的量化值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710539393.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频渲染器及视频渲染方法
- 下一篇:一种视频处理系统