[发明专利]基因选择方法和装置在审

专利信息
申请号: 202010982171.4 申请日: 2020-09-17
公开(公告)号: CN112215259A 公开(公告)日: 2021-01-12
发明(设计)人: 陈慧灵;周伟;汪鹏君 申请(专利权)人: 温州大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/00;G16B20/20;G16B40/00
代理公司: 北京云嘉湃富知识产权代理有限公司 11678 代理人: 李思霖
地址: 325006 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基因 选择 方法 装置
【说明书】:

发明提供一种基因选择方法,用于基因特征选择。包括通过基因数据微阵列数据集获取训练集和测试集,并确定初始化种群;将当前种群的每个个体采用转换函数进行二进制编码;计算当前种群的适应度值,并更新樽海鞘和飞蛾扑火策略中的相关参数;设置正余弦优化算法的相关参数,并采用正余弦优化算法迭代公式更新种群;将通过正余弦优化算法获取的种群依次通过樽海鞘,飞蛾扑火和反向学习策略进行更新,以获取三个种群;通过贪婪选择选出下一代种群;若达到最大迭代次数,则结束循环并输出最优解,否则继续迭代直至迭代计算结束。本发明可更精确、更高效地从基因中筛选出对类别贡献最大的基因特征,降低检测成本。

技术领域

本发明涉及数据预处理领域的基因选择技术,尤其涉及一种基因选择方法。

背景技术

在当今竞争激烈的世界里,人类受到各种疾病的影响尤其是癌症,白血病等,医学检测有助于确定各种疾病的症状和原因。随着生物医学和健康领域相关技术的快速发展,大量的生物信息学和临床医学数据尤其是分子生物学实验数据、基因数据以前所未有的速度增长。目前人类虽然已经在分子水平上对各种疾病的产生和发展过程进行研究,发现大量的致病基因,但是人们对其发生和调控机制了解甚微。微阵列基因表达数据和蛋白质表达数据的分析可以用来掌握分子水平上生理活动信息。

然而,微阵列数据中的基因个数成千上万,其中一部分基因特征可能和挖掘任务是不相关的或者特征之间存在相互冗余。实际上,与样本分类真正相关的基因只占少数,这些冗余基因特征可能会导致检测算法的建模过度拟合和训练时间过长、从而导致错误的检测结果,甚至会导致延误造成患者生命的损失。

近年来,相关领域的研究者针对微阵列数据进行分析,采用不同类型的机器学习算法和统计方法,如人工神经网络和进化算法等,已被用于分析基因表达数据。但由于基因数据维度较高,并且具有较多的噪声,越来越多的智能算法在微阵列数据分析时变得更重要。挖掘最小基因子集大大减少了由无关基因引起的计算负担和“噪声”,甚至可以提取简单的检测规则,从而在不需要任何分类器的情况下进行准确检测,而且简化了基因表达测试,仅包括少数基因而不是数千个基因,这可以显著降低检测的成本,它要求进一步研究这些少数基因与疾病发展和治疗之间可能存在的生物学关系。基于粒子群算法、蝙蝠算法的基因选择方法,收获了相当好的分类结果。

正余弦优化算法(Sine Cosine Algorithm,SCA)是一种新兴的启发式群体智能算法,它采用正弦和余弦函数两个数学公式,在整个搜索空间上不断探索和开发的过程。然而,SCA在基因筛选的过程中,在优化解的收敛速度以及收敛精度上,仍然具有很高的提升空间。在这种情况下,很难保持勘探和开发的有效平衡。

因此,有必要提供一种基因选择方法,实现对基因表达数据更精确、更高效的除噪,降低检测成本。

发明内容

本发明在深入研究基因微阵列数据的特点的基础上,针对目前的存在的问题,设计了一种基因选择方法,以实现对基因表达数据更精确、更高效的除噪。

具体地,根据本发明一方面,本发明实施例提供了一种基因选择方法,所述方法包括以下步骤:

步骤S1、通过基因数据微阵列数据集获取训练集和测试集,并确定初始化种群;

步骤S2、将当前种群的每个个体的每个特征值采用转换函数进行二进制编码;

步骤S3、计算当前种群的适应度值,并更新樽海鞘和飞蛾扑火策略中的相关参数;

步骤S4、设置正余弦优化算法的相关参数,并采用正余弦优化算法迭代公式更新种群;

步骤S5、将通过正余弦算法获取的种群依次通过樽海鞘,飞蛾扑火和反向学习策略进行更新,以获取三个种群;

步骤S6、通过贪婪选择选出下一代种群;

步骤S7、若达到最大迭代次数,则结束循环并输出最优解,否则继续迭代直至迭代计算结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010982171.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top