[发明专利]基于不对称划分模式的高效视频编码加法树并行实现方法有效
| 申请号: | 201510991839.0 | 申请日: | 2015-12-27 |
| 公开(公告)号: | CN105578189B | 公开(公告)日: | 2018-05-25 |
| 发明(设计)人: | 谢晓燕;崔继兴;蒋林;吴进;芦守鹏 | 申请(专利权)人: | 西安邮电大学 |
| 主分类号: | H04N19/176 | 分类号: | H04N19/176;H04N19/105;H04N19/119;H04N19/137;H04N19/436;H04N19/51 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
| 地址: | 710121 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 加法树 高效视频编码 并行实现 分块模式 划分模式 计算效率 存储 不对称 像素块 数字视频编解码 处理元阵列 并行处理 并行结构 处理单元 串行结构 存储方式 分割模式 计算过程 数量缩减 运动估计 运算效率 传统的 单像素 亮度块 二维 合并 | ||
基于不对称划分模式的高效视频编码加法树并行实现方法涉及数字视频编解码技术领域。本发明采用二维处理元阵列结构,对亮度块分割模式的SAD值计算并行处理,有效的提升了运动估计运算效率。通过采用根据该SAD值后续是否被使用选取存储该SAD值的PE的方法,加快加法树的计算速度,提高计算效率。通过采用单PE存储4*4像素块的方式,相对于传统的像素块的存储方式(单PE存储单像素),处理单元使用的数量缩减至原来的1/16。相对于加法树串行结构的实现方法,该并行结构速度提高了近92倍。三十六种分块模式SAD值的计算均通过4*4分块模式的SAD值合并得到的,可以减少过多的计算过程,提高计算效率。
技术领域
本发明涉及数字视频编解码技术领域,特别是高效视频编码(High EfficiencyVideo Coding,简称HEVC)中的整像素运动估计方法。
背景技术
运动估计是视频编码和视频处理中广泛使用的技术。运动估计的基本思想是由于活动图像邻近帧中的景物存在一定的相关性,因此可以将图形中的每一帧分成互不重叠的块,并且认为块中所有像素的位移量都相同。然后设法搜出每一个块在邻近帧中的位置,并且得出两者在空间位置的相对偏移量,得到的相对偏移量就是通常所说的运动矢量,得到运动矢量的过程就被称为运动估计。
随着视频质量不断提高H.264已经不能满足压缩要求,因此2013年1月26号 HEVC正式成为国际上最新的视频压缩标准。但是运动估计传统的SAD运算体系结构通常会采用和最大编码块像素相同的运算阵列来进行运算,例如针对H.264的运动估计架构,宏块大小为16×16像素,因此进行运动估计的SAD运算单元阵列为256个运算单元。而对于HEVC而言,最大编码块尺寸为64×64像素,如若采用相同或者类似的设计架构,则需要4096个运算单元,仅在SAD运算这一部分,其面积是H.264的架构的16倍,从而硬件面积大大增加。
因此研究并设计能够支持HEVC视频编码标准的整数运动估计的SAD加法树结构,并不是套用原有的架构,而是要重新设计其架构。该架构可以满足64×64块的 SAD计算,并且没有增加硬件面积。
发明内容
本发明所要解决的技术问题是提供一种基于不对称划分模式的高效视频编码加法树并行实现方法,以提升SAD值的计算效率。
为实现上述目的,本发明所采用的技术方法如下:
基于不对称划分模式的高效视频编码加法树并行实现方法,根据像素块之间的数据相关性,在邻接互连的二维处理元阵列上,通过使用18*17个处理元完成64×64亮度块三十七种分块模式的SAD值计算的并行处理,其中处理元即PE包括:
步骤1加法树模块(图2)经由缓存区1(图2)和缓存区2(图2)从外存加载64×64亮度块(图3),并且以4×4大小的像素块按照(图5)的存储方式(自上到下、从左到右)存放到PE阵列中,每个处理元即PE存放一个4×4大小的亮度块,该方法具体包括:
首先将64×64的亮度块,分成大小为32×64的两部分(图7),分别通过缓存区1和缓存区2加载到处理元阵列中。
步骤2加法树模块经由缓存区1和缓存区2从外存中读取64×64参考块(图 4),并且以4×4大小的像素块按照(图6)的存储方式(自上到下、从左到右),存放到PE 阵列中,每个处理元(PE)存放一个4×4大小的参考块,该方法具体包括:
首先将64×64的参考块,分成大小为32×64的两部分(图7),分别通过缓存区1和缓存区2加载到处理元阵列中。
步骤3处理元阵列(图2)中的各个PE,在获取的亮度块和参考块的基础上,根据公式(1)同时计算4×4分块模式SAD值(SAD4×4),计算完成后存放到亮度块和参考块对应的PE中,一共256个SAD4×4值,该方法具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510991839.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:弹珠锁
- 下一篇:辊式带材稳定机构的设计方法及装置





