[发明专利]基于最优停止理论的编码模式快速自动选择方法无效

专利信息
申请号: 201210435266.X 申请日: 2012-11-02
公开(公告)号: CN102957932A 公开(公告)日: 2013-03-06
发明(设计)人: 王瀚漓;衡岳 申请(专利权)人: 同济大学
主分类号: H04N13/00 分类号: H04N13/00;H04N7/26
代理公司: 上海科盛知识产权代理有限公司 31225 代理人: 赵继明
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 最优 停止 理论 编码 模式 快速 自动 选择 方法
【说明书】:

技术领域

发明涉及一种视频编码方法,尤其是涉及一种基于最优停止理论的编码模式快速自动选择方法。

背景技术

随着人们对视觉体验的要求越来越高,市场上出现了三维电视(3DTV)和自由视点电视(FTV)等新兴电子设备,多视点视频编码标准Multi-view Video Coding(MVC)应运而生。MVC通过一组摄像头从不同角度对同一场景进行拍摄,得到的视频数据为3DTV和FTV提供视频源数据。

一般来说,视频序列中存在大量的冗余信息,主要分为以下三种:空间冗余信息、时间冗余信息和统计冗余信息。视频编码技术通过有效合理地去除这些冗余信息,从而达到视频压缩的目的。在视频编码中,一般通过帧间编码技术对Predicted frames(P帧)和Bi-directional predictive frames(B帧)进行编码。B、P帧与前后帧之间存在大量相似内容:编码B帧时,通过参考前后两个方向的已编码帧来去除时间冗余;编码P帧时,只参考前面一个方向的已编码帧;以上方法可以去除大量的时间冗余信息。一般通过帧内编码技术对Intra coded frames(I帧)进行编码,I帧不参考其他帧的信息,只利用自身的信息进行编码。由于相邻像素之间像素值紧密相关,可以通过邻近像素对当前像素进行预测以去除空间冗余信息。对于预测之后得到的残差信号利用信源的统计信息进行变换、量化和熵编码,从而进行高效压缩。

和H.264/AVC单视点视频编码标准相比,MVC必须处理和摄像机数量成比例的数据量,这个数据量是极大的。在网络带宽等系统资源有限的情况下,如何有效处理如此巨大的数据量成为MVC应用的一个瓶颈。

除了前面所提的三种冗余信息外,MVC还存在着一种不可忽视的冗余信息,即为视差冗余信息。由于每个摄像头都是对同一场景进行拍摄,所不同的仅仅是对场景的取景角度,所以不同摄像头所得到的视频序列间存在大量相似信息。对于视差冗余信息,一般利用视差估计来去除视差冗余信息。

作为H.264/AVC的扩展,MVC中宏块大小的划分也是灵活可变的。在MVC中,有7种宏块划分大小,分别是:16×16(像素为单位)、16×8、8×16、8×8、8×4、4×8、4×4,如图1所示。

一般对于细节较少、图像变化较平缓的区域,选择的块尺寸会大一些;对于图像中细节较多的区域选择的块尺寸会小一些。对帧间预测而言,每个宏块都要进行运动估计,并且相应地有一个运动矢量,也就是空间位置的相对偏移量,在解码端通过运动矢量指明的位置,从已经解码得到的邻近参考帧中得到对应的块,和预测残差相加后就得到所需要解码的块。另外,如果宏块进行视差估计,会相应地有一个视差矢量,视差是指同一个点在不同视点的对应图像中投影点之间的位置偏差,包括各摄像机的相对运动及场景中对象的运动所产生的差异。在解码端通过视差矢量,可以从参考视点的对应宏块得到所要解码的宏块。如果宏块划分地很细致,那么所得到的子块数量会增多,相应的运动矢量/视差矢量也会增多,用来表示运动矢量/视差矢量的比特数也相应地增加,需编码的视频信息量就会变大,所以如何选择宏块尺寸大小就显得极为重要。

在视频编码中,不仅存在不同大小的宏块,每一个宏块还有Intra,Inter,SKIP三种可选编码方式。Intra模式又包含Intra4×4、Intra8×8和Intra16×16三种。对宏块的亮度分量而言,Intra4×4和Intra8×8分别有9种预测方向,分别是:垂直预测、水平预测、平均预测、左对角预测、右对角预测、垂直右对角预测、水平向下预测、垂直左对角预测和水平向上预测。对于Intra16×16存在4种预测方向,分别是:水平预测、垂直预测、平均预测和平面预测。对于宏块的Intra8×8色度块预测,存在的4种预测方向和Intra16×16的4种预测方向相同,并且两种色度成分常用同一种预测方向。

在如此众多的预测方式中,如何选择最佳方式对当前宏块进行编码是极为重要的。最简单的方法是遍历所有模式,从中选出一个最佳的方式,这样就存在一个选择标准。在MVC中,采用拉格朗日率失真优化策略(Rate Distortion Optimization,RDO)作为评价准则,即通过遍历所有可能的模式,最后选择率失真代价最小的模式作为最佳编码模式,公式为:

J(s,c,m|QP,λm)=D(s,c,m|QP)+λmR(s,c,m|QP)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210435266.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top