[发明专利]基于最优停止理论的编码模式快速自动选择方法无效

申请号：	201210435266.X	申请日：	2012-11-02
公开（公告）号：	CN102957932A	公开（公告）日：	2013-03-06
发明（设计）人：	王瀚漓;衡岳	申请（专利权）人：	同济大学
主分类号：	H04N13/00	分类号：	H04N13/00;H04N7/26
代理公司：	上海科盛知识产权代理有限公司 31225	代理人：	赵继明
地址：	200092 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于最优停止理论编码模式快速自动选择方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种视频编码方法，尤其是涉及一种基于最优停止理论的编码模式快速自动选择方法。

背景技术

随着人们对视觉体验的要求越来越高，市场上出现了三维电视(3DTV)和自由视点电视(FTV)等新兴电子设备，多视点视频编码标准Multi-view Video Coding(MVC)应运而生。MVC通过一组摄像头从不同角度对同一场景进行拍摄，得到的视频数据为3DTV和FTV提供视频源数据。

一般来说，视频序列中存在大量的冗余信息，主要分为以下三种：空间冗余信息、时间冗余信息和统计冗余信息。视频编码技术通过有效合理地去除这些冗余信息，从而达到视频压缩的目的。在视频编码中，一般通过帧间编码技术对Predicted frames(P帧)和Bi-directional predictive frames(B帧)进行编码。B、P帧与前后帧之间存在大量相似内容：编码B帧时，通过参考前后两个方向的已编码帧来去除时间冗余；编码P帧时，只参考前面一个方向的已编码帧；以上方法可以去除大量的时间冗余信息。一般通过帧内编码技术对Intra coded frames(I帧)进行编码，I帧不参考其他帧的信息，只利用自身的信息进行编码。由于相邻像素之间像素值紧密相关，可以通过邻近像素对当前像素进行预测以去除空间冗余信息。对于预测之后得到的残差信号利用信源的统计信息进行变换、量化和熵编码，从而进行高效压缩。

和H.264/AVC单视点视频编码标准相比，MVC必须处理和摄像机数量成比例的数据量，这个数据量是极大的。在网络带宽等系统资源有限的情况下，如何有效处理如此巨大的数据量成为MVC应用的一个瓶颈。

除了前面所提的三种冗余信息外，MVC还存在着一种不可忽视的冗余信息，即为视差冗余信息。由于每个摄像头都是对同一场景进行拍摄，所不同的仅仅是对场景的取景角度，所以不同摄像头所得到的视频序列间存在大量相似信息。对于视差冗余信息，一般利用视差估计来去除视差冗余信息。

作为H.264/AVC的扩展，MVC中宏块大小的划分也是灵活可变的。在MVC中，有7种宏块划分大小，分别是：16×16(像素为单位)、16×8、8×16、8×8、8×4、4×8、4×4，如图1所示。

一般对于细节较少、图像变化较平缓的区域，选择的块尺寸会大一些；对于图像中细节较多的区域选择的块尺寸会小一些。对帧间预测而言，每个宏块都要进行运动估计，并且相应地有一个运动矢量，也就是空间位置的相对偏移量，在解码端通过运动矢量指明的位置，从已经解码得到的邻近参考帧中得到对应的块，和预测残差相加后就得到所需要解码的块。另外，如果宏块进行视差估计，会相应地有一个视差矢量，视差是指同一个点在不同视点的对应图像中投影点之间的位置偏差，包括各摄像机的相对运动及场景中对象的运动所产生的差异。在解码端通过视差矢量，可以从参考视点的对应宏块得到所要解码的宏块。如果宏块划分地很细致，那么所得到的子块数量会增多，相应的运动矢量/视差矢量也会增多，用来表示运动矢量/视差矢量的比特数也相应地增加，需编码的视频信息量就会变大，所以如何选择宏块尺寸大小就显得极为重要。

在视频编码中，不仅存在不同大小的宏块，每一个宏块还有Intra，Inter，SKIP三种可选编码方式。Intra模式又包含Intra4×4、Intra8×8和Intra16×16三种。对宏块的亮度分量而言，Intra4×4和Intra8×8分别有9种预测方向，分别是：垂直预测、水平预测、平均预测、左对角预测、右对角预测、垂直右对角预测、水平向下预测、垂直左对角预测和水平向上预测。对于Intra16×16存在4种预测方向，分别是：水平预测、垂直预测、平均预测和平面预测。对于宏块的Intra8×8色度块预测，存在的4种预测方向和Intra16×16的4种预测方向相同，并且两种色度成分常用同一种预测方向。

在如此众多的预测方式中，如何选择最佳方式对当前宏块进行编码是极为重要的。最简单的方法是遍历所有模式，从中选出一个最佳的方式，这样就存在一个选择标准。在MVC中，采用拉格朗日率失真优化策略(Rate Distortion Optimization，RDO)作为评价准则，即通过遍历所有可能的模式，最后选择率失真代价最小的模式作为最佳编码模式，公式为：

J(s，c，m|QP，λ_m)＝D(s，c，m|QP)+λ_mR(s，c，m|QP)

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于同济大学，未经同济大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210435266.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N13-00 立体电视系统；其零部件
H04N13-02 .图像信号发生器
H04N13-04 .图像重现装置

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于最优停止理论的编码模式快速自动选择方法无效

专利文献下载