[发明专利]分层结构预判的快速视频编码方法有效

专利信息
申请号: 201110098369.7 申请日: 2011-04-20
公开(公告)号: CN102186070A 公开(公告)日: 2011-09-14
发明(设计)人: 刘鹏宇;贾克斌 申请(专利权)人: 北京工业大学
主分类号: H04N7/26 分类号: H04N7/26;H04N7/34
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 魏聿珠
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分层 结构 快速 视频 编码 方法
【说明书】:

技术领域

发明涉及视频压缩编码领域,设计和实现了一种分层结构预判的快速视频编码方法。

背景技术

视频序列中主要包括三种冗余信息:空间冗余,时间冗余,统计冗余。通常利用视频信息自身相关性,能够去除视频数据中的冗余信息,达到视频压缩的目的。在视频压缩中主要采用I帧和P(B)帧编码技术;I帧是帧内编码方法,即对视频中的某一帧单独编码,用来消除空间冗余;P(B)帧是帧间编码方法,利用相邻帧的相关性消除时间冗余;再利用熵编码方法消除统计冗余。

H.264/AVC(以下简称H.264)作为最新视频编码标准,引入了众多先进的编码技术,如多方向的帧内预测编码、可变块的帧间预测编码、1/4象素精度的运动估计、多参考帧编码等,使其具有比以往标准更出色的编码性能,受到了业界人士广泛的重视和欢迎。

然而H.264更高编码性能的获得是以巨大编码复杂度为代价的。在相同信噪比条件下,H.264码率较H.263节省50%左右;但H.264编码计算复杂度约为H.263的4~5倍,约为MPEG-4的3倍,编码实时性较差。因此,如何降低H.264编解码器的计算复杂度就成为H.264能否尽快进入大规模实际商用,取得成功的关键因素之一。

研究表明,H.264编码计算复杂度的80%主要来自运动估计和模式选择。尤其是帧间模式选择技术,对当前编码宏块以全搜索的方式遍历计算帧间和帧内下的所有预测模式,计算极为复杂,如图1。

为了获得最佳编码效率,减小以往视频编码标准采用单一宏块划分模式而带来的编码误差,在帧间编码中,H.264采用可变尺寸块的编码模式,每个当前编码宏块可划分为:16×16,16×8,8×16和8×8,其中8×8又称为亚分割模式,还可以继续划分为8×8,8×4,4×8和4×4,如图2。同时支持Skip模式,即直接拷贝前一参考帧中对应宏块的编码模式。H.264中的运动搜索是以子块为单位的,所以16×16宏块中的每个子块都有一个独立的运动矢量。显然,宏块中的子块划分得愈细,对残差值进行编码所需的位数就愈小,但因此而带来的问题是有更多的运动矢量需要进行编码,这会导致整个宏块编码所需的比特数增加。因此,在具体编码时需要根据运动估计后的残差值大小和需要的运动矢量编码代价来优化选择宏块的编码模式。

在帧内预测中,H.264充分利用相邻像素的空间相关性,支持Intra4×4和Intra16×16两种帧内预测编码。对于当前编码宏块的亮度分量而言,Intra4×4包含9种预测方向(垂直预测,水平预测,平均预测,左对角预测,右对角预测,垂直右对角预测,水平向下预测,垂直左对角预测,水平向上预测);Intra16×16包含4种预测方向(水平预测、垂直预测、DC预测和平面预测)。对于当前编码宏块的色度分量而言,帧内预测类似于亮度分量的Intra16×16,也包含4种预测方向。因此,当前编码宏块的帧内预测可达[4+(16×9)]×4=592次,计算量相当可观。

H.264基于率失真代价准则,通过拉格朗日率失真优化函数(Rate-Distortion Optimization,RDO),计算每种预测模式的率失真代价值(RD-cost),选择具有最小RD-cost的预测模式为最优的帧间预测模式(见图3)。这种方法虽然能够选择出具有最优率失真意义的帧间预测模式,但计算量显著增加,导致H.264编码速度下降,成为限制其在实时视频领域应用的瓶颈之一。

发明内容

本发明的提出主要基于以下技术思路:

视频图像基本可以分为背景纹理平坦区域、背景纹理细致区域和运动区域三大类:通常背景纹理平坦区域或者运动平缓区域在视频内容中占有很大比重,大多采取Skip(mode0)或宏块级预测(mode1~3);仅在纹理复杂或者运动剧烈的区域使用亚分割预测(mode4~7);只有在视频图像的边缘部分才选择帧内预测(见表1)。

表1不同类型视频序列中各种帧间预测编码模式利用率%

由表1可见,各种帧间预测模式在视频图像中是非均匀分布的。

对于Akiyo,Miss America,Mother & Daughter等纹理平坦或者运动平缓的视频序列较多采用Skip和宏块级预测;而Coastguard,Foreman,Mobile等纹理丰富或者运动剧烈的视频序列较多采用亚分割预测;整体上宏块级预测明显多于亚分割预测;不论何种类型的视频序列,选择帧内预测的概率都很低。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110098369.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top