[发明专利]用于对数字图像序列进行编码的方法在审
申请号: | 201280036836.6 | 申请日: | 2012-07-11 |
公开(公告)号: | CN103688544A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | A.魏因利希;P.阿蒙;A.胡特;A.考普 | 申请(专利权)人: | 西门子公司 |
主分类号: | H04N19/51 | 分类号: | H04N19/51;H04N19/182;H04N19/615 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 蒋骏;刘春元 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数字图像 序列 进行 编码 方法 | ||
技术领域
本发明涉及一种用于对数字图像序列进行编码的方法以及用于解码的对应方法。此外,本发明涉及一种编码设备和解码设备以及一种用于对图像序列进行编码和解码的系统。
背景技术
为了图像的快速且有效的传输和存储,使用压缩算法以便利用图像中的空间、时间和概率冗余性。在视频编码中,已知基于区块的运动补偿技术,其设法在使用在时间方向上的基于区块的过渡运动预测和补偿时减少空间变化。为此,确定图像序列中的当前图像中包括若干个像素的预定义区块相对于前一图像的运动,使强度差范数最小化。将此运行信息用于预测,只须传输包含少得多的变化的残余误差以便在解码器处获得无损重构。基于区块的方法具有在已解码图像中的区块边界处产生区块伪像的缺点。在现有技术中描述了基于区块的运动补偿的若干改进,例如自适应区块尺寸、帧内编码的自适应选择、来自多个在前和后续图像的加权预测、环路内滤波,等等。
除基于区块的运动补偿之外,还存在用于基于像素的运动补偿的方法。通过此运动补偿,能够使用基于像素的运动矢量场来描述任意运动。这些方法具有缺点,即由于大量的运动矢量,所以必须将很多侧面信息传输至解码器。为了减少此侧面信息,文献[1]描述了稠密运动矢量场的稀疏表示,其中,仅仅相对于其预测能力的显著运动矢量被编码。
发明内容
本发明的目的是提供一种用于以高编码效率对数字图像序列进行编码(即以高压缩率提供良好的已解码图像质量)的方法。
根据独立权利要求来解决此目的。在从属权利要求中限定了优选实施例。
本发明的方法被用于对数字图像序列进行编码,其中,每个图像具有相同的图像格式且包括具有所分配的像素值的多个像素。由于相同的图像格式,图像格式中的每个像素对应于每个图像中的预定像素。根据本发明的方法,确定第一和第二图像之间的运动参数,其中,基于所述运动参数,执行运动补偿以便对图像序列进行编码,其中,所述运动参数被包括在已编码图像序列中。术语“图像”将被广泛地解释且可以指的是任意的像素阵列,例如像素的二维或三维或更高维度阵列。
根据本发明的方法的特征在于新种类的运动参数。即,第一图像与第二图像之间的运动参数包括标量场而不是运动矢量,其中,所述标量场具有用于该图像格式中的多个图像位置的标量值。那些图像位置不需要对应于像素位置。在下述优选实施例中,标量场包括在多个图像位置处已知的标量值,这些图像位置的数目低于图像格式中的像素的数目。根据本发明的标量场被确定为使得从标量场导出的梯度矢量对应于用于运动补偿的运动矢量,即梯度矢量与运动矢量相同,或者能够通过将梯度矢量与因数相乘来确定运动矢量。由图像内的标量场的众所周知的梯度来表示梯度矢量。由于标量场的定义,该梯度矢量对应于如在现有技术编码技术中所定义的运动矢量。
本发明的编码方法具有的优点在于,代替运动矢量,在已编码图像序列中包括标量场,因此减少了侧面信息并导致更高的编码效率。此外,由于本发明的方法并不基于图像区块,所以消除了成块伪像。这在向已编码位流中的信息,例如向在预测编码中所计算的预测误差,应用去相关方法的情况下导致更好的压缩。
本发明基于的实现在于,能够基于标量场来表示某些图像序列中的运动矢量。优选地通过搜索标量场来确定此场,该标量场使第二图像的像素值与第一运动补偿图像的像素值之间的残余误差最小化,其中,基于从标量场导出的梯度矢量来确定第一运动补偿图像。即,基于使残余误差最小化的优化问题的解来确定标量场。然而,在实际实现中,不一定找到绝对最小值。根据编码努力,还能够将次最佳解用于标量场。尽管如此,还是通过搜索使残余误差最小化的标量场来找到此解。
在优选实施例中,由第二和第一图像之间的绝对像素值差的和来表示残余误差,其中,每个绝对像素值差对应于第二图像中的第二像素位置处的像素值与第一图像中的第一像素位置处的像素值之间的绝对差,所述第一像素位置对应于由所述第二像素位置处的标量场的采样版本的梯度矢量所补偿的第二像素位置。术语“绝对差”将被广泛地解释且还可以例如包括平方差。在特定优选实施例中,标量场包括用于小于图像格式中的像素数目的图像位置的标量值,其中,通过对标量场的上采样版本进行内插来确定标量场的采样版本。在本实施例中,由于包括减少数目的标量值的标量场的使用而减少了要传输以用于解码的侧面信息。在上述实施例的优选变体中,由窗口化正弦函数,特别是Lanczos滤波器,来对标量场的上采样版本进行内插。也可以使用其他内插技术,例如样条内插。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子公司,未经西门子公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280036836.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于视频译码的调适参数集
- 下一篇:一种用于视频编码的码率估计方法