[发明专利]基于最优停止理论的编码模式快速自动选择方法无效
申请号: | 201210435266.X | 申请日: | 2012-11-02 |
公开(公告)号: | CN102957932A | 公开(公告)日: | 2013-03-06 |
发明(设计)人: | 王瀚漓;衡岳 | 申请(专利权)人: | 同济大学 |
主分类号: | H04N13/00 | 分类号: | H04N13/00;H04N7/26 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 最优 停止 理论 编码 模式 快速 自动 选择 方法 | ||
技术领域
本发明涉及一种视频编码方法,尤其是涉及一种基于最优停止理论的编码模式快速自动选择方法。
背景技术
随着人们对视觉体验的要求越来越高,市场上出现了三维电视(3DTV)和自由视点电视(FTV)等新兴电子设备,多视点视频编码标准Multi-view Video Coding(MVC)应运而生。MVC通过一组摄像头从不同角度对同一场景进行拍摄,得到的视频数据为3DTV和FTV提供视频源数据。
一般来说,视频序列中存在大量的冗余信息,主要分为以下三种:空间冗余信息、时间冗余信息和统计冗余信息。视频编码技术通过有效合理地去除这些冗余信息,从而达到视频压缩的目的。在视频编码中,一般通过帧间编码技术对Predicted frames(P帧)和Bi-directional predictive frames(B帧)进行编码。B、P帧与前后帧之间存在大量相似内容:编码B帧时,通过参考前后两个方向的已编码帧来去除时间冗余;编码P帧时,只参考前面一个方向的已编码帧;以上方法可以去除大量的时间冗余信息。一般通过帧内编码技术对Intra coded frames(I帧)进行编码,I帧不参考其他帧的信息,只利用自身的信息进行编码。由于相邻像素之间像素值紧密相关,可以通过邻近像素对当前像素进行预测以去除空间冗余信息。对于预测之后得到的残差信号利用信源的统计信息进行变换、量化和熵编码,从而进行高效压缩。
和H.264/AVC单视点视频编码标准相比,MVC必须处理和摄像机数量成比例的数据量,这个数据量是极大的。在网络带宽等系统资源有限的情况下,如何有效处理如此巨大的数据量成为MVC应用的一个瓶颈。
除了前面所提的三种冗余信息外,MVC还存在着一种不可忽视的冗余信息,即为视差冗余信息。由于每个摄像头都是对同一场景进行拍摄,所不同的仅仅是对场景的取景角度,所以不同摄像头所得到的视频序列间存在大量相似信息。对于视差冗余信息,一般利用视差估计来去除视差冗余信息。
作为H.264/AVC的扩展,MVC中宏块大小的划分也是灵活可变的。在MVC中,有7种宏块划分大小,分别是:16×16(像素为单位)、16×8、8×16、8×8、8×4、4×8、4×4,如图1所示。
一般对于细节较少、图像变化较平缓的区域,选择的块尺寸会大一些;对于图像中细节较多的区域选择的块尺寸会小一些。对帧间预测而言,每个宏块都要进行运动估计,并且相应地有一个运动矢量,也就是空间位置的相对偏移量,在解码端通过运动矢量指明的位置,从已经解码得到的邻近参考帧中得到对应的块,和预测残差相加后就得到所需要解码的块。另外,如果宏块进行视差估计,会相应地有一个视差矢量,视差是指同一个点在不同视点的对应图像中投影点之间的位置偏差,包括各摄像机的相对运动及场景中对象的运动所产生的差异。在解码端通过视差矢量,可以从参考视点的对应宏块得到所要解码的宏块。如果宏块划分地很细致,那么所得到的子块数量会增多,相应的运动矢量/视差矢量也会增多,用来表示运动矢量/视差矢量的比特数也相应地增加,需编码的视频信息量就会变大,所以如何选择宏块尺寸大小就显得极为重要。
在视频编码中,不仅存在不同大小的宏块,每一个宏块还有Intra,Inter,SKIP三种可选编码方式。Intra模式又包含Intra4×4、Intra8×8和Intra16×16三种。对宏块的亮度分量而言,Intra4×4和Intra8×8分别有9种预测方向,分别是:垂直预测、水平预测、平均预测、左对角预测、右对角预测、垂直右对角预测、水平向下预测、垂直左对角预测和水平向上预测。对于Intra16×16存在4种预测方向,分别是:水平预测、垂直预测、平均预测和平面预测。对于宏块的Intra8×8色度块预测,存在的4种预测方向和Intra16×16的4种预测方向相同,并且两种色度成分常用同一种预测方向。
在如此众多的预测方式中,如何选择最佳方式对当前宏块进行编码是极为重要的。最简单的方法是遍历所有模式,从中选出一个最佳的方式,这样就存在一个选择标准。在MVC中,采用拉格朗日率失真优化策略(Rate Distortion Optimization,RDO)作为评价准则,即通过遍历所有可能的模式,最后选择率失真代价最小的模式作为最佳编码模式,公式为:
J(s,c,m|QP,λm)=D(s,c,m|QP)+λmR(s,c,m|QP)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210435266.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种头带式耳机
- 下一篇:一种图像处理方法、装置及系统