[发明专利]一种新的特征选择与参数优化方法在审
申请号: | 201910020771.X | 申请日: | 2019-01-09 |
公开(公告)号: | CN109816000A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 武玉坤;肖杰;李伟;楼吉林 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 西安研创天下知识产权代理事务所(普通合伙) 61239 | 代理人: | 孙李林 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种新的特征选择与参数优化方法,属于机器学习、深度学习、数据挖掘技术领域,包括以下步骤:参数初始化;数据预处理;特征子集选取;适应度函数与评估;终止条件。本发明使用灰狼优化算法来进行支持向量机的特征选择和参数优化,同时融合了支持向量机的渐进性,从而将灰狼优化算法的搜索导向到超参数空间的好区中的最佳泛化误差直线上。本质是将支持向量机的性能特征融入算法,使其不仅具备灰狼优化算法的搜索功能,而且具有融合渐近性灰狼个体的搜索功能,因而新算法具备更强的搜索力度,分类准确率得到显著提高。 | ||
搜索关键词: | 支持向量机 参数优化 特征选择 优化算法 搜索功能 搜索 数据挖掘技术 参数初始化 分类准确率 适应度函数 数据预处理 参数空间 机器学习 特征子集 性能特征 终止条件 融合 渐进性 新算法 算法 评估 融入 学习 | ||
【主权项】:
1.一种新的特征选择与参数优化方法,其特征在于,包括以下步骤:(1)参数初始化首先初始化灰狼优化算法的基本参数,包括灰狼个数,每个个体的维度,初始位置以及迭代次数等;由于在提出的优化SVM模型中需要寻找最优的(c,σ)组合和最优的特征子集,所以搜索空间是2+n维的并且灰狼的每个位置就是一个(c,σ)与特征子集组合;根据初始化的灰狼种群,随机选择三个灰狼个体作为Xα,Xβ和Xδ;(2)数据预处理采用最小‑最大规范化,即对原始数据进行线性变换,使每个特征可以缩放到范围[0,1],转换公式如下:
其中x为样本属性的原始值,min为样本数据属性的最小值,max为样本数据属性的最大值,x*是变换后的值;(3)特征子集选取根据最优灰狼个体Xα的前n个值进行特征提取,保留相关特征,丢弃不相关的特征,用训练特征子集和测试特征子集分别进行SVM训练和测试训练好的模型的泛化能力;(4)适应度函数与评估提出了新的适应度函数,如以下公式,此适应度函数的最优值可以获得最高的准确率,最小的特征子集和最少的支持向量;
其中是SVM_accuracy是分类准确率,WA是其权重;WF是特征数量的权重,Fi是第i个特征,被选中取1,未选中取0,Ci是第i个特征的权重,nf是数据集的总特征数;Vi表示第i个样本,若是支持向量则取值为1,否则取0,l是总的样本数,WV是支持向量的权重,一般取值0.05;由于每个灰狼个体表示(C,σ)组合和选取的特征子集,当用测试集获取了准确率后,每个灰狼个体就可用以上公式进行评估,从而选择出最优的灰狼个体Xα,Xβ和Xδ;(5)终止条件当满足终止条件时,获得最优参数组合和最优的特征子集,否则继续根据公式进行下一代的更新,在本发明提出的模型中,当最大迭代次数或者最优解获得时,终止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910020771.X/,转载请声明来源钻瓜专利网。