[发明专利]一种大整数乘法Karatsuba算法的并行实现方法有效
申请号: | 201510996000.6 | 申请日: | 2015-12-25 |
公开(公告)号: | CN105653239B | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 蒋丽娟;杜胜;杨超;许永超;刘芳芳;钟伟;赵玉文;申超 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F7/53 | 分类号: | G06F7/53 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 成金玉;孟卜娟 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法 大整数乘法 并行实现 并行化 存储方式 公式转换 任务分担 算法效率 指针运算 第一层 多线程 递归 归并 线程 整型 编程 并行 存储 | ||
本发明公开了一种大整数乘法Karatsuba算法的并行实现方法,基于64位无符号长整型整数操作,通过巧妙的公式转换技巧,指针运算以及存储方式,以解决部分积存储与计算的相关性问题,通过OpenMP多线程编程,采用section任务分担策略将算法进行并行化,从而开启8个线程在递归程序的第一层并行求取8个部分积,每个section负责一个部分积的计算任务,待部分积均求取完毕后进行串行归并,从而并行化Karatsuba算法,提高算法效率。
技术领域
本发明涉及一种大整数乘法Karatsuba算法的并行实现方法,通过开启多个线程并行计算,提高计算机多核利用率,从而提高算法效率。
背景技术
Karatsuba算法是当大整数数位较小时调用的重要底层大整数快速乘法算法,该算法应用非常广泛,其通过分治思想以及巧妙的运算技巧以加减运算代替部分乘法运算,降低了算法计算时间复杂度,然而该运算本身在运行时仍然具有较大空间开销和时间开销,尤其当数据达到一定规模时,其内存空间和计算时间的消耗将是巨大的。因此提高Karatsuba算法的性能尤为必要。Karatsuba算法作为重要的大整数底层乘法运算如果能够提高运行速度,整个计算的运行效率将会大大改善,在实际应用中也有着十分重要的作用。
伴随着多核处理器和加速部件的普及,通过充分挖掘算法本身的并行度将算法并行化,高效地提升算法性能,已经成为一种行之有效的方法。目前Karatusba算法优化方面,Tudor Jebelean曾在9核paclib计算机中将算法进行3线程和9线程并行,其中基为229,与串行算法相比,3线程并行最高可达2.93倍加速,9线程最高可达7.98倍加速,该并行算法虽然有较好的性能加速,但性能平台依赖性大,数据表示能力受到限制。
Karatsuba算法基于分治思想,将参与运算的乘数与被乘数进行拆分,通过运算技巧将部分乘法操作转换为加减操作,表述如下:假设乘数u、被乘数v均为2n位,拆分为两部分后分别为u1、u0和v1、v0,位数均为n,R为基,则u、v可分别表示成如(1)、(2)所示:
u=u1*Rn+u0 (1)
v=v1*Rn+v0 (2)
则由公式(1)和(2)得:
r=u*v=u1*v1*R2n+(u1*v0+u0*v1)Rn+u0*v0 (3)
由公式(3)可转化为如下公式:
r=u1*v1*R2n+[u1*v1+u0*v0-(u1-u0)*(v1-v0)]Rn+u0*v0 (4)
基于公式(4),可将2n位的大整数乘法转换成3个n位的大整数乘法以及若干次加法和减法运算,减少单精度乘法的次数,而部分积也可采用相似的方法求解,从而提高算法执行效率。
Tudor Jebelean所提出的并行化Karatusba算法策略虽然已经达到了很好的效果,但是其实现时基为229,数据表达能力受到限制,且受限于机器平台的核数为3或9时性能达到最优。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510996000.6/2.html,转载请声明来源钻瓜专利网。