[发明专利]一种基于确定性粒子群优化和支持向量机的肿瘤识别方法有效
| 申请号: | 201710122492.5 | 申请日: | 2017-03-03 |
| 公开(公告)号: | CN106971091B | 公开(公告)日: | 2020-08-28 |
| 发明(设计)人: | 韩飞;李佳玲;凌青华;周从华;崔宝祥;宋余庆 | 申请(专利权)人: | 江苏大学 |
| 主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B25/10;G06K9/62;G06N3/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 212013 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 确定性 粒子 优化 支持 向量 肿瘤 识别 方法 | ||
1.一种基于确定性粒子群优化和支持向量机的肿瘤识别方法,其特征在于,包括下列步骤:
步骤1肿瘤基因表达谱数据集的预处理,首先将肿瘤基因表达谱数据集划分为训练集和测试集,然后对数据集进行归一化处理,获取最终的关键基因子集;步骤2提出确定性粒子群优化算法IGPSO,在训练集上,使用确定性粒子群优化算法优化支持向量机SVM;步骤3在测试集上,使用步骤2中优化得到的支持向量机SVM来对肿瘤基因表达谱数据集进行识别;
所述步骤2中使用确定性粒子群优化算法优化支持向量机SVM包含下列步骤:
步骤3.1:设定SVM的C,σ参数搜索空间,mi,min≤mi≤mi,max,其中惩罚因子C,核函数参数σ,mi为第i个参数的值,i表示参数个数,这里设置为2,算法开始时在搜索空间上随意选择一个参数值m;SVM的分类规则方程如式(7):
训练集T{(xi,yi);xi∈Rn;yi=±1;i=1,2,...,r},其中:xi为训练样本,x为待判断样本,b为门限,αi是拉格朗日乘子,K(xi,x)为核函数;
支持向量机求解的最优化问题和所构建的分类决策函数如下:
其中K(x,xi)为核函数,xi为训练样本,b为门限,αi是拉格朗日乘子,其作用是将其特征空间映射到高维空间;在实际应用中,特征基因数量小,所以采用基于RBF的SVM分类器对肿瘤样本进行分类,RBF表示如下:
步骤3.2:设置粒子群的大小为N,分类准确率要求为F,扩展因子为Ex,局域大小为w=[w1,w2],最大重试次数为Tmax,重试次数t和扩大因子开始为0;
步骤3.3:算法开始时根据初始化的搜索空间p=[p1,p2],按扩展因子Ex扩大搜索空间,按步骤3.4至3.7计算局域位置,使得局域落在搜索空间p+0.6Ex*w中;
步骤3.4:计算x对应的分类性能函数fp;
步骤3.5:以IGPSO算法寻找最优值,得出最优值对应的分类性能函数fc;
步骤3.6:若搜索到更好的分类率,即fp<fc,则t和Ex置为0,否则t=t+1;
步骤3.7:若t≥Tmax,则置t为0,Ex=Ex+1,此时有可能已陷入局部最优,增大搜索范围以便跳出当前的局部区域;
步骤3.8:若达到分类准确率要求,即fp≤F,则输出{C,σ}的值和分类准确率,算法结束,否则转步骤3.3;
对支持向量机的两个参数进行初始设置,其搜索范围{0<C<16,0<σ<6},最大重试次数设置为10,C的扩大步长为0.3,σ的扩大步长为0.1,结合最终关键基因子集,用IGPSO算法对支持向量机的这两个参数进行优化,IGPSO算法在局域内粒子按照性能函数的分类率对参数{C,σ}的梯度方向进行搜索,如果达到最大重试次数,未找到更好的分类率,则扩大搜索范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710122492.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基因测序数据压缩和传输方法
- 下一篇:基于云平台的USB加密卡管理系统





