[发明专利]一种基于遗传算法的分类算法参数优化方法在审
| 申请号: | 201510004522.3 | 申请日: | 2015-01-06 |
| 公开(公告)号: | CN104572993A | 公开(公告)日: | 2015-04-29 |
| 发明(设计)人: | 韦鹏;付兴旺;吴楠;朱英澍 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/12 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
| 地址: | 250101 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 遗传 算法 分类 参数 优化 方法 | ||
技术领域
本发明公开一种分类算法参数优化方法,属于算法参数优化领域,具体地说是一种基于遗传算法的分类算法参数优化方法。
背景技术
遗传算法是计算数学中用于解决最佳化的搜索算法,是进化算法的一种。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择以及杂交等。遗传算法通常实现方式为一种计算机模拟。分类,Categorization or Classification,就是按照某种标准给对象贴标签,再根据标签来区分归类。分类是事先定义好类别,类别数不变。
而分类算法是模式识别和数据挖掘领域中非常重要的问题,多数分类算法中包含一些可变的参数,这些参数在一定程度上影响了分类算法的性能和效率。参数的选择及优化是多数分类算法运用的关键,本发明针对分类算法的参数优化问题,提出一种基于遗传算法的分类算法参数优化方法。该方法将所有参数按照数值进行离散化并按顺序连接为一个二进制编码序列,每一个体对应一个二进制串,分类算法的各考核指标数值加权作为适应度,由该适应度作为判定个体优劣的标准,维护一个群体,群体包括若干个体。通过交叉、变异、选择按照优胜劣汰的原则不断的更新这个群体,将最终获得的群体进行译码对应相应的参数数值,进而得到最优的参数组合,该方法适用于各种对参数敏感受参数约束的分类算法中。
发明内容
本发明针对分类算法的参数优化问题,提出一种基于遗传算法的分类算法参数优化方法,实现了针对群体进行译码对应相应的参数数值,进而得到最优的参数组合,该方法适用于各种对参数敏感受参数约束的分类算法中。
本发明提出的具体方案是:
一种基于遗传算法的分类算法参数优化方法,具体步骤为:
①制定编码及解码规则:根据分类算法的性能指标采集数据信号,对采集数据信号的参数制定二进制串与参数数值一一对应,对于每个参数,规定其取值范围为[a,b],数值取值精度为v,则二进制串的长度为:
L=[log2(b-a)/v;
编码时,对于任意在[a,b]范围内该参数的取值x,其二进制串对应的整数值:
xint=[(x-a)/v];
解码时,对于任意一个小于2L-1的正整数n,其对应的该参数的取值为:
(n+0.5)v+a;
②种群初始化:对于每个参数的取值作为一个个体,并将多个个体集合为一个种群,同时种群中的所有个体均进行二进制串对应后形成初始化种群;初始化种群中各个体适应度值计算:对于分类算法的数据集,将所有的数据样本随机分为训练样本和测试样本,采用适应度函数,函数的输入即为编码之后的二进制串,函数的计算过程描述如下:从二进制串解码得到各个参数数值,分别记为;将上述参数带入分类算法中,得到分类算法评估的指标,分别记为;将上述的得到的指标进行加权求和,即所得的适应度,其计算公式如下:
;
③循环迭代:对二进制串进行循环迭代,更新这个群体,需要多次计算适应度,计算过的参数组合的指标可保存到数据库或内存中,循环迭代时需要先查表该参数组合是否存在,如存在则取出对应指标即可,如不存在则重新计算各指标并保存,循环迭代到一定次数达到;
④解码得到最优参数:对步骤③中最终获得的群体进行解码对应相应的参数数值,群体中所有个体的适应度值,选出群体中适应度值高的多个个体作为子代群体,进而得到最优的参数组合,判断是否终止:当进化群体中个体的最大适应度值大于或等于预先设定的适应度设定值时,遗传算法终止并输出当前所获得群体中最优的参数组合;否则,返回步骤③,继续进行循环迭代。
所述的步骤①中分类算法的性能指标指的是:
训练时间:利用参数训练时,所耗费的实际时间,要多次进行训练,取所有训练时间的中值;
分类时间:利用该参数得到的分类模型对测试样本进行分类时,所耗费的实际时间,为保证时间的准确性,要多次进行训练和分类,取所有时间的中值;
训练样本准确率:利用该参数训练时,算法结束时对训练样本分类的准确率,多次进行训练,取所有训练样本准确率的中值;
测试样本准确率:利用该参数分类时,算法对测试样本分类的准确率;
测试样本召回率:利用该参数分类时,算法对测试样本分类的召回率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510004522.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于核应急处置的应急模拟演练一体机
- 下一篇:一种在页面绘制图形的方法和装置





