[发明专利]重新排序的变换系数的多级表示有效
| 申请号: | 200980116564.9 | 申请日: | 2009-04-01 |
| 公开(公告)号: | CN102017634A | 公开(公告)日: | 2011-04-13 |
| 发明(设计)人: | C·图;S·瑞古纳萨恩;S·孙;C-L·林 | 申请(专利权)人: | 微软公司 |
| 主分类号: | H04N7/30 | 分类号: | H04N7/30;H04N7/24 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 杨洁;钱静芳 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 重新 排序 变换 系数 多级 表示 | ||
背景
在编码诸如视频帧或静止图像等图片时,编码器通常将虚拟数据拆分成多块样本值。编码器执行诸如离散系数变换(DCT)等频率变换来将该块样本值转换成一块变换系数。按惯例在一个块的左上方示出的变换系数一般称为DC系数,并且其他系数一般称为AC系数。对于样本值的大多数块,频率变换往往将非零变换系数值组织到左上方,那里是该块变换系数的较低频率部分。
在频率变换之后,编码器量化变换系数值。量化一般减少DC和AC系数的可能值的数量。这一般将量化值的分辨率以及保真度降低到原始系数值,但它使后续熵编码更加高效。在较高频率系数具有被量化成零的低振幅时,量化往往还“移除”较高频率系数(一般被组织在该块的右下侧)。
图1示出量化之后的变换系数的8×8的块(100)的一个示例。在该示例性块(100)中,该块左上角中的值25是DC系数,而另63个值是AC系数。虽然该块(100)中的最高振幅系数是左上角的低频系数,但沿着右侧,该块包括较高频率的一簇非零系数值。
在量化了变换系数后,编码器对经量化的变换系数进行熵编码。一种对一块变换系数进行编码的常见方法通过使用“z字形”扫描次序(200)对该块进行重新排序来开始,如图2所示。在该方法中,编码器根据该扫描次序(200)将来自二维阵列的变换系数的值映射成一维串。扫描次序200在块(100)的带有DC系数的左上角开始,遍历该块(100)的位置1和2处的AC系数,遍历位置3、4和5处的AC系数,以此类推。该扫描根据扫描次序(200)来在该块(100)上跨对角线地继续,在该块(100)的具有最高频率AC系数的右下角位置63处结束。因为量化操作通常将较低值、较高频系数的显著一部分量化成零,同时保留较高值、较低频系数的非零值,所以z字形扫描重新排序通常造成剩余非零变换系数中的大多数都靠近一维串的开头且大量零值在该串的结尾。
图2示出将扫描次序(200)应用于该块(100)变换系数所得到的示例性一维串(250)。在该示例中,一维串(250)以与该块(100)的DC系数相对应的值25开始。扫描次序随后读取值12,此后是两个0,值-52,以此类推。符号“EOB”表示“块结束”并指示该块中的所有其余值都是0。
编码器随后使用行程长度编码或行程级别编码来对系数值的该一维向量进行熵编码。在行程级别编码中,编码器遍历该一维向量,将连续零值的每一行程编码成行程计数并将每一非零值编码成一个级别。对于简单编码,编码器向行程计数和级别值分配如Huffman码的可变长度码。
简单编码的一个问题是行程计数可以从0到64变化,只对于行程计数就需要65个代码的字母表。如果编码器将行程计数与后续非零级别值联合编码(以利用行程计数和级别值之间的相关),则行程计数-级别字母表的大小更大,这增加了熵编码的复杂度(例如,由于码表大小和查找操作)。将转义码用于较不频繁的组合帮助控制码表大小,但可降低编码效率。
在编码器对各行程级别组合使用同一可能的代码值而不管哪些AC系数被编码的情况下,行程级别编码发生另一问题。如果对于较高频率AC系数而言,遇到长行程的零值的机会增加,则对各行程级别组合使用同一可能代码值有损效率。
最后,在一些情况下,使用图2所示的z字形扫描次序(200)进行重新排序可损害编码效率。一般而言,一个块内的邻居系数值是相关的——如果变换系数值是零,则其邻居更可能是零,并且如果该变换系数值为非零,则其邻居更可能为非零。在一些情况下,使用z字形扫描次序(200)的重新排序在一维向量中将各邻居系数位置(例如,位置15和27)分开。例如,虽然图1中的该块(100)中的非零系数出现在两个簇中,但图2的一维串(250)中的非零系数值被一个或多个“0”值的序列打断4次。
鉴于编码和解码对于数字视频的关键重要性,编码和解码是充分开发的领域并不令人惊奇。然而,不论先前的视频编码和解码技术的好处如何,它们都没有以下技术和工具的优点。
概述
总体而言,“详细描述”呈现了用于编码和解码各块频率系数的技术和工具。例如,这些技术和工具通过改进各块频率系数的压缩来改进编码器的性能。通过在一维串中将频率系数的非零值编组在一起来增加压缩效率,并随后根据多级嵌套集合表示来对这些系数值进行熵编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200980116564.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种保护可编程器件的方法和装置
- 下一篇:一种多层扁挤压筒过盈量的设计方法





