[发明专利]一种基于确定性粒子群优化和支持向量机的肿瘤识别方法有效
申请号: | 201710122492.5 | 申请日: | 2017-03-03 |
公开(公告)号: | CN106971091B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 韩飞;李佳玲;凌青华;周从华;崔宝祥;宋余庆 | 申请(专利权)人: | 江苏大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B25/10;G06K9/62;G06N3/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 确定性 粒子 优化 支持 向量 肿瘤 识别 方法 | ||
本发明公开了一种基于确定性粒子群优化和支持向量机的肿瘤识别方法,包括对肿瘤基因表达谱数据的预处理,在训练集上运用分类信息指数方法对信息基因进行初选,然后使用两两冗余方法去除冗余基因得到备选基因库;在训练集上进一步使用分类信息指数方法获取关键的基因子集;在训练集上使用确定性粒子群优化算法对支持向量机的参数进行优化,然后对待识别的肿瘤基因表达谱数据进行识别。本发明在充分利用支持向量机适合于小样本数据识别的特点上,运用确定性粒子群优化对支持向量机进行优化,进一步提高支持向量机的性能,从而提高肿瘤识别准确性。
技术领域
本发明属于肿瘤基因表达谱数据的计算机分析技术的应用领域,具体涉及一种基于确定性粒子群优化和支持向量机的肿瘤识别方法。
背景技术
DNA微阵列技术为生物学带来了巨大的机遇,但是其产生的大量和复杂的微阵列数据,给相关领域的学者们提出了巨大的挑战,其主要原因有四:第一,微阵列数据中含有大量噪声或异常值。因为实验过程中常常会产生噪声以及异常值,且数据处理过程也会带来误差或样本类别标记错误,因此,希望能够设计鲁棒性强的处理方法。第二,基因表达谱数据规模庞大,如何处理大规模数据集也是需要解决的难点之一。因此,设计计算和空间复杂度都较低的有效算法就变得非常有意义。第三,微阵列数据具有高维度,低样本的特征。基因表达谱数据集,其分类运算规模随基因数据增长而呈指数级增长,所以如何应对维数灾难问题也是难点之一。第四,微阵列数据中具有非线性特点,且隐藏了大量实用信息。因此,使经典的统计分析方法转变成非线性分析方法处理非线性数据集,以及利用这些方法来挖掘和推导这些潜在的生物信息显得非常重要。
自从1999年Golub等开创了基因表达谱的肿瘤分类领域的先河以来,学者已经陆续提出很多基于基因表达谱的分类方法,其中有部分算法已经被普遍应用。按不同的分类算法可以设计出不同的分类器,如贝叶斯,支持向量机,人工神经网络等经典分类器,它们能依据已知的样本类别信息来进行学习,以提取样本分类的信息。基于这些分类器在肿瘤分类领域的实验结果表明,不同的分类器对同一数据集的分类能力有所不同,也就是说一个好的分类器很难对所有的数据集的分类性能都很高。SVM的优点是适用于处理高维小样本数据,且分类精度高,抗噪声能力强,不需要调整和输入大量的参数。除此之外,具有可度量性,即通过训练后支持向量的个数一般比较小,这对矩阵维数不断增加的基因表达谱来讲非常有效。虽然SVM适用于小样本数据识别,但SVM中参数的选取比较费时,并且目前还没有有效的理论支持SVM中参数的选取,从而影响SVM的分类性能。
粒子群算法(Particle Swarm Optimization,PSO)具有良好的全局搜索能力。相对于遗传算法,PSO具有无复杂的遗传操作,可调参数少,易于实现等优点,因此近年来它得到了广泛的应用。而传统PSO由于粒子搜索的随机性,盲目搜索次数较多,导致搜索时间较长,搜索性能有待提高。因此,将基于梯度搜索的确定性搜索引入粒子群优化算法,通过将随机搜索和确定性搜索结合起来提高种群的搜索速度和精度。
发明内容
本发明发明目的:运用改进的粒子群优化算法(IGPSO)来优化支持向量机的参数,从而提高支持向量机的搜索性能,并应用于肿瘤表达谱数据的识别,以提高肿瘤识别准确性。相对于传统肿瘤表达谱识别方法,该方法有效地提高了肿瘤识别准确率。
技术方案:一种基于确定性粒子群优化和支持向量机的肿瘤识别方法,包括基于分类信息指数和两两冗余方法的基因子集筛选,以及利用确定性粒子群优化算法(improved particle swarm optimization based on gradient search,IGPSO)优化支持向量机来实现肿瘤基因表达谱数据的识别,包括下列步骤:
步骤1肿瘤基因表达谱数据集的预处理,首先将肿瘤基因表达谱数据集划分为训练集和测试集,然后对数据集进行归一化处理,获取最终的关键基因子集;
步骤2提出确定性粒子群优化算法(IGPSO),在训练集上,使用确定性粒子群优化算法优化支持向量机(SVM);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710122492.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基因测序数据压缩和传输方法
- 下一篇:基于云平台的USB加密卡管理系统