[发明专利]一种非均匀锯齿搜索的运动估计方法无效
申请号: | 200910045942.0 | 申请日: | 2009-01-22 |
公开(公告)号: | CN101489132A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 王贺;滕国伟;王国中;张锦辉;严涛 | 申请(专利权)人: | 上海广电(集团)有限公司中央研究院 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/32 |
代理公司: | 上海思微知识产权代理事务所 | 代理人: | 屈 蘅;李时云 |
地址: | 200233*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 均匀 锯齿 搜索 运动 估计 方法 | ||
技术领域
本发明涉及数字视频编码技术,尤其涉及一种非均匀锯齿搜索的运动估计方法。
背景技术
随着AVS、H.264等高级视频编码技术逐渐成熟,采用相应技术的数字视频编码器逐步有了市场需求,对于视频编码器的研究也成为一项重要的工作。帧间预测是视频编码器中的重要部分,而帧间预测的主要途径是基于单个宏块的运动估计(ME,motion estimation),最佳匹配块在运动估计中通过搜索来确定。由于全搜索方法的控制逻辑相对简单,而且数据复用效率高,所以当前基于超大规模集成电路(VLSI)的视频编码器大多采用全搜索方案,由于全搜索对搜索窗(SW,search window)内所有搜索点进行搜索,每个搜索点代表一个宏块位置,以33×33大小的SW为例,搜索点有1089个,如此多的搜索点使得ME的并行数达到了5~8路,所以资源消耗和功耗较大。除了全搜索方法,还有运动估计的快速算法,但是一般是面向串行执行过程设计的,而且控制逻辑复杂,所以难以应用于VLSI结构。如果能够在VLSI结构上利用快速算法的原理减少搜索点数目,可以极大降低VLSI逻辑资源消耗。
在清华大学视频通信研究组提出的JVT-F017提案中(参见Zhibo Chen,PengZhou,Yun He,Yidong Chen,"Fast Integer Pel and Fractional Pel Motion Estimationfor JVT",JVT-F017,Joint Video Team(JVT)of ISO/IEC MPEG & ITU-T VCEG(ISO/IEC JTC1/SC29/WG11 and ITU-T SG16Q.6),Awaji,December,2002),提出了一种快速搜索方法,并被H.264参考软件接纳,但是搜索点之间的数据难以复用,所以很难应用于VLSI实现。此外,公开日为2008年6月4日,公开号为CN101193303的中国专利,提供了一种快速搜索方法,但此方法面对的应用对象还是软件,不利于硬件实现。
发明内容
本发明解决的技术问题是提供一种非均匀锯齿搜索运动估计方法,所述方法结合运动估计的统计特征在一定的搜索范围内设定特征点和特征区域,通过非均匀的锯齿搜索实现搜索点数的减少,降低并行数。
为了解决上述技术问题,本发明采用了如下技术手段:一种非均匀锯齿搜索的运动估计方法,所述方法是先将当前编码帧划分为互不重叠的、固定大小的块,然后针对每个要被编码的当前块,在参考帧的一搜索区域内搜索出与当前块匹配误差最小的块,即最佳匹配块,最后根据最佳匹配块所在点,即最佳匹配点的位置,输出最佳匹配块与当前块的相对位移,即运动矢量,所述的搜索过程是这样实现的:
步骤1、在大小为S*T的搜索区内,以搜索区的中心为原点(0,0),根据最佳匹配点出现的概率,选取八个特征点和一个特征区,所述八个特征点的坐标分别为P1(-m,n)、P2(-k,l)、P3(k,l)、P4(m,n)、P5(m,-n)、P6(k,-l)、P7(-k,-l)和P8(-m,-n),所述特征区为以搜索区的中心为中心,大小为a*a的区域,其中S,T,m,n,k和l均为自然数,且0<k<m<(S-1)/2,0<n<l<(T-1)/2;
步骤2、设通过搜索区中心的水平轴和竖直轴与搜索区边界的交点分别为A(-(S-1)/2,0)、B((S-1)/2,0)、C(0,(T-1)/2)和D(0,-(T-1)/2),在点A、B、C和D中选取离搜索区中心较远的两点分别作为搜索起始点和搜索终止点;将通过搜索区中心的水平轴和竖直轴穿过的点,以及特征区内的点作为全搜索点;
步骤3、从搜索起始点开始逐点搜索最佳匹配点,搜索路径经过全部特征点及全搜索点,搜索路径沿单方向水平或竖直移动,路径不重复,并且每移动一个点计算一次累计绝对值差SAD值,并保留最小的SAD值及其坐标,直至搜索终止点;
步骤4、保存最小的SAD值及其坐标,SAD最小值所在坐标对应的块即为本次搜索的最佳匹配块。
所述的m的取值范围为[4,(s-1)/2);k的取值范围为[3,m);n的取值范围为[2,(s-1)/2);及l的取值范围为(n,(s-1)/2),其中s取S和T中的较小值。
当所述的S等于T时,搜索起始点和搜索中止点分别为点(A,B)或(C,D)中的任一组。
所述的a的取值可以为3、5或7中的任一值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海广电(集团)有限公司中央研究院,未经上海广电(集团)有限公司中央研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910045942.0/2.html,转载请声明来源钻瓜专利网。