[发明专利]基于遗传算法的确定用于矩阵乘法的矩阵分块参数的方法在审
申请号: | 202011374455.1 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112380018A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 孙成国 | 申请(专利权)人: | 海光信息技术股份有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F17/16;G06N3/12 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
地址: | 300392 天津市华苑产业区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 遗传 算法 确定 用于 矩阵 乘法 分块 参数 方法 | ||
1.一种基于遗传算法的确定用于矩阵乘法的矩阵分块参数的方法,包括:
获取用于矩阵乘法的矩阵分块参数边界;
基于所述矩阵分块参数边界,随机生成第一数量的矩阵分块参数,并将所述第一数量的矩阵分块参数作为待优化种群中的第一数量的个体;
对于所述第一数量的矩阵分块参数中的每个矩阵分块参数,利用该矩阵分块参数进行矩阵分块并相应地执行矩阵乘法,获取基于该矩阵分块参数的矩阵乘法的性能指标,并将该性能指标作为该矩阵分块参数所对应个体的个体适应度;
基于所述待优化种群中各个体的个体适应度,通过个体选择、个体交叉和个体变异,构建优化后种群;以及
在所述优化后种群满足预定条件的情况下,从所述优化后种群中选出具有最优性能指标的个体作为用于矩阵乘法的矩阵分块参数。
2.如权利要求1所述的方法,其中,利用该矩阵分块参数进行矩阵分块并相应地执行矩阵乘法,获取基于该矩阵分块参数的矩阵乘法的性能指标,包括:
利用所述矩阵分块参数作为基本线性代数子程序库配置文件中的矩阵分块参数;
重新编译安装所述基本线性代数子程序库,生成动态链接库;
生成用于进行矩阵乘法的第一矩阵和第二矩阵,基于所述动态链接库,对所述第一矩阵和第二矩阵进行矩阵分块,并对所述第一矩阵和第二矩阵进行矩阵乘法;以及
获得所述动态链接库执行所述矩阵乘法的性能指标。
3.如权利要求2所述的方法,其中所述性能指标是CPU使用采用了所述矩阵分块参数的所述基本线性代数子程序库每秒执行浮点运算的次数。
4.如权利要求1所述的方法,还包括:
基于CPU中寄存器的实际结构及其能存储的最大数据量来确定矩阵分块内核参数,其中,所述矩阵分块内核参数表示矩阵分块的基本单元;
其中,基于所述矩阵分块参数边界,随机生成第一数量的矩阵分块参数,包括:
基于所述矩阵分块参数边界和所述矩阵分块内核参数,随机生成第一数量的矩阵分块参数,其中,每个所述矩阵分块参数内的各个元素是所述矩阵分块内核参数内的对应元素的整数倍。
5.如权利要求1所述的方法,还包括:
获取用于所述遗传算法的预设交叉率和预设变异率;
其中,基于所述待优化种群中各个体的个体适应度,通过个体选择、个体交叉和个体变异,构建优化后种群,包括:
将所述待优化种群中具有最高个体适应度的个体选入第一种群;
将所述待优化种群中具有较高的个体适应度的个体选入所述第一种群;
将所述第一种群中的个体进行两两随机分组,形成多个个体对,其中每个个体对对应于一个个体对交叉率,对于所述个体对交叉率小于所述预设交叉率的相应个体对进行个体交叉,生成新的个体对并选入所述第一种群;
确定所述第一种群中每个个体的个体变异率,对于所述个体变异率小于所述预设变异率的相应个体进行个体变异,生成新的个体并选入所述第一种群,即形成优化后种群。
6.如权利要求1所述的方法,其中,所述预定条件是构建优化后种群的迭代次数达到预设的最大迭代次数。
7.如权利要求1所述的方法,其中,所述预定条件是构建优化后种群的迭代过程中具有最优性能指标的个体趋于稳定,即多次迭代所得的优化后种群中具有最优性能指标的个体相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海光信息技术股份有限公司,未经海光信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011374455.1/1.html,转载请声明来源钻瓜专利网。