[发明专利]基于GPU的Zernike矩快速计算方法有效
| 申请号: | 201711062242.3 | 申请日: | 2017-11-02 | 
| 公开(公告)号: | CN107741881B | 公开(公告)日: | 2020-05-05 | 
| 发明(设计)人: | 玄玉波;王世刚;王丽 | 申请(专利权)人: | 吉林大学 | 
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06T1/20 | 
| 代理公司: | 沈阳铭扬联创知识产权代理事务所(普通合伙) 21241 | 代理人: | 屈芳 | 
| 地址: | 130012 吉*** | 国省代码: | 吉林;22 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | 基于GPU的Zernike矩快速计算方法属正交矩加速技术领域,本发明提出存径向多项式系数结合图像重布局的八卦限对称性算法,该混合算法能显著地加快任意单个矩的计算速度。提出在一个内核Kernel中组合Block的组包方案,加快一族或一组矩的计算。而合并内核的组包方案能进一步缩短一组或者一族图像的矩的计算时间,特别是能克服小尺寸图像中由于计算量小,不能有效实施混合算法的瓶颈。本发明能推动Zernike矩在实时图像处理和模式识别等领域中的发展,可应用于视频图像水印、镜头分割、光学系统中波前重建、机器视觉系统中目标定位和识别检测,其它正交矩的快速计算提供了非常有价值的参考。 | ||
| 搜索关键词: | 基于 gpu zernike 快速 计算方法 | ||
【主权项】:
                一种基于GPU的Zernike矩快速计算方法,其特征在于,包括两部分内容:基于GPU的存径向多项式系数结合图像重布局的八卦限对称性算法的混合算法和基于GPU的内核合并的组包方案;1.1所述的基于GPU的存径向多项式系数结合图像重布局的八卦限对称性算法的混合算法包括下列步骤:1.1.1将笛卡尔坐标下N×N图像的坐标[i,j],映射到单位内切圆[x,y]的映射变换,归一化以后的坐标为:x=2(i-N2+0.5)N,y=2(k-N2+0.5)N]]>其中:i=tid%N,k=tid/N,tid为线程索引,其值从0到(N×N‑1);x轴、y轴、直线y=x和直线y=‑x将单位圆分为8个象限,称为八卦限,8个一维数组h1,h2,h3…h8表示八卦限中像素值;用第1卦限中的地址索引值计算对应的极径ρ和极角θ的值,即将计算结果放入2个一维数组,存储到全局内存中;1.1.2将步骤1.1.1中的所有一维数组中对角线上重复的像素值置0;1.1.3计算径向多项式系数c(n,m,s):c(n,m,s)=(-1)s(n-s)!s!(((n+|m|)/2-s)!((n-|m|)/2-s)!)]]>其中:n为阶数,m为角频,n是非负正整数,m是整数,且满足n‑|m|为偶数,|m|<n;s为[0‑(n‑|m|)/2]的整数;1.1.4通过4个Kernel在GPU中计算n阶m角频的Zernike矩,计算过程分为下列4个步骤:1.1.4.1在GPU的Kernel 1中,将八卦限的灰度值按照相同的索引地址是对称点的规则,重新载入到8个一维的数组h1,h2,h3…h8;1.1.4.2在GPU的Kernel 2中,将1.1.1中的第1卦限的极角θ通过查找表取出,计算八卦限映射和gmr(x,y)=[h1+h2+h3+h4+h5+h6+h7+h8]cos(mθ),m=4k[h1-h4-h5+h8]cos(mθ)+[h2-h3-h6+h7]sin(mθ),m=4k+1[h1-h2-h3+h4+h5-h6-h7+h8]cos(mθ),m=4k+2[h1-h4-h5+h8]cos(mθ)+[-h2+h3+h6-h7]sin(mθ),m=4k+3]]>gmi(x,y)=[h1-h2+h3-h4+h5-h6+h7-h8]sin(mθ),m=4k[h1+h4-h5-h8]sin(mθ)+[h2+h3-h6-h7]cos(mθ),m=4k+1[h1+h2-h3-h4+h5+h6-h7-h8]sin(mθ),m=4k+2[h1+h4-h5-h8]sin(mθ)+[-h2-h3+h6+h7]cos(mθ),m=4k+3]]>1.1.4.3在GPU的Kernel 3中,将步骤1.1.1中的第1卦限中的极径ρ和步骤1.1.3的径向多项式系数c(n,m,s)通过查找表的方式取出,代入径向多项式:Rnm(ρ)=Σs=0(n-|m|)/2c(n,m,s)ρn-2s]]>1.1.4.4在GPU的Kernel 3中,将步骤1.1.4.3的径向多项式计算结果和步骤1.1.4.2的八卦限映射与相乘求Zernike矩的映射;1.1.4.5在GPU的Kernel 4中将步骤1.1.4.4的Zernike矩的映射使用并行归约求和,并将最终结果输出到CPU;1.2.所述的基于GPU的内核合并的组包方案,计算第n阶m个角频的一族Zernike矩时,包括下列步骤:1.2.1重复步骤1.1.1至1.1.3中的计算;1.2.2重复步骤1.1.4.1的Kernel 1计算步骤;1.2.3重复步骤1.1.4.2的Kernel 2计算步骤;1.2.4在Kernel 3中,采用顺序执行模式,保留原线程块Block和线程束Warp调用方式,通过线程块Block组包,将n阶(floor(n/2)+1)个Zernike矩的八卦限映射与径向多项式相乘的计算合并到一起,由图像尺寸和阶数n决定组包线程块数量;1.2.5在Kernel 4中,同样使用线程块Block组包,使用并行归约将n阶的(floor(n/2)+1)个Zernike矩的映射求和,将结果输出到CPU。
            
                    下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
                
                
            该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711062242.3/,转载请声明来源钻瓜专利网。





