[发明专利]用于编码和解码的多级有效图有效
申请号: | 201210421030.0 | 申请日: | 2012-10-29 |
公开(公告)号: | CN103096065A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 阮·阮;计天颖;何大可 | 申请(专利权)人: | 捷讯研究有限公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 苏志莲 |
地址: | 加拿大安大*** | 国省代码: | 加拿大;CA |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 编码 解码 多级 有效 | ||
版权声明
本文档和附属材料的公开的一部分包含要求了版权的材料。版权人不反对任何人对如在专利和商标局的文件或记录中发表的专利文档或专利公开的复制,但是无论如何保留所有其他版权权利。
技术领域
本申请总体涉及数据压缩,具体地涉及使用多级有效图对视频进行编码和解码的方法和设备。
背景技术
数据压缩发生在众多上下文中。在通信和计算机联网中非常普遍地使用数据压缩,以有效地存储、传输和复制信息。其在图形、音频和视频的编码方面得到了具体应用。由于每个视频帧所需的大量数据以及经常需要发生的编码和解码的速度,视频对数据压缩提出相当大的挑战。视频编码的当前最新技术是ITU-T H.264/AVC视频编码标准。该标准定义了针对不同应用的多个不同简档,包括主简档、基线简档等等。通过MPEG-ITU的联合发起,当前正在开发的下一代视频编码标准是高效视频编码(HEVC)。
存在用于编码/解码图像和视频的多个标准,包括H.264,其使用基于块的编码过程。在这些过程中,图形或帧被分成块,通常是4×4或8×8,并且块被频谱变换成系数、量化、和熵编码。在许多情况中,被变换的数据不是实际像素数据,而是预测操作之后的残差数据。预测可以是:帧内的,即帧/图像内的块到块;或者帧间的,即在帧之间(也称为运动预测)。期望HEVC(也称为H.265)将也具有这些特征。
当对残差数据进行频谱变换时,这些标准中的多个标准规定了使用离散余弦变换(DCT)或基于它的一些变型。然后使用量化器对所得DCT系数进行量化,以产生量化后的变换域系数或索引。
然后,使用具体的上下文模型对量化后的变换域系数的块或矩阵(有时称为“变换单元”)进行熵编码。在H.264/AVC中和在针对HEVC的当前开发工作中,量化后的变换系数通过下述方式来编码:(a)对指示块中的最后一个非零系数的位置的末位有效系数位置进行编码;(b)对指示块中的包含非零系数的位置(除了末位有效系数位置)的有效图进行编码;(c)对非零系数的幅度进行编码;以及(d)对非零系数的符号进行编码。对量化后的变换系数的编码常常占到比特流中的编码数据的30-80%。
变换单元通常是N×N。常见大小包括4×4、8×8、16×16和32×32,尽管其他大小也是可能的。对有效图中的符号的熵编码基于上下文模型。在4×4的亮度(luma)或色度块或变换单元(TU)的情况下,TU中的每个系数位置与单独的上下文相关联。也即,针对4×4的亮度或色度TU,编码器和解码器跟踪总共30个(不包括右下角位置)单独的上下文。将8×8的TU划分成(出于上下文关联的目的,在概念上进行划分)2×2的块,使得8×8TU中的每个2×2的块与一个不同的上下文相关联。因此,针对8×8的亮度或色度TU,编码器和解码器跟踪总共16+16=32个上下文。这意味着,在对有效图的编码和解码期间,编码器和解码器跟踪和查找62个不同的上下文。当考虑16×16的TU和32×32的TU时,所涉及的不同上下文的总数是88。在附加的26个上下文中,13个针对亮度TU,而13个针对色度TU。如下将这13个上下文分配到16×16的TU或32×32的TU中的系数位置。令(r,c)表示TU中的位置,其中,如果TU的大小是16×16,则0<=r,c<=15,如果TU的大小是32×32,则0<=r,c<=31。然后,将3个不同的上下文分配给包括DC位置(0,0)在内的左上角的三个位置(0,0)、(0,1)、(1,0);将5个不同的上下文分配给区域{(r,c):2<=r+c<5}中的位置;以及将最后5个不同上下文分配给所有剩余位置。除了前三个针对(0,0)、(0,1)、(1,0)的上下文之外,针对区域{(r,c):2<=r+c<5}中的位置的上下文的推导取决于其右下方的邻居。令s(r,c)表示位置(r,c)处的系数的有效标记,即,如果系数不等于0,则s(r,c)=1,否则s(r,c)=1。针对位置(r,c)的上下文等于min(s(r+1,c)+s(r,c+1)+s(r+2,c)+s(r,c+2)+s(r+1,c+1),4),其中min(a,b)返回a和b之间的较小的值。类似地推导剩余区域{(r,c):r+c>=5}中的位置(r,c)的上下文。
针对4×4和8×8的有效图的上下文通过比特位置来确定。针对16×16和32×32有效图的上下文主要通过相邻比特的值来确定。针对16×16和32×32有效图的上下文的确定的计算强度相当大,因为在大多数情况下处理器通过查找相邻有效标记的值来确定上下文,其涉及代价高昂的存储器存取操作。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于捷讯研究有限公司,未经捷讯研究有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210421030.0/2.html,转载请声明来源钻瓜专利网。