[发明专利]基于改进灰狼优化算法的差异代谢物分析方法及系统在审
申请号: | 202111334354.6 | 申请日: | 2021-11-11 |
公开(公告)号: | CN114091590A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 潘红宇;陈善雄;曲存民;尹能文;王定旺;李加纳;申树林;唐云山;胡冉;向思柔 | 申请(专利权)人: | 西南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00;G16B20/00 |
代理公司: | 重庆上义众和专利代理事务所(普通合伙) 50225 | 代理人: | 郭维 |
地址: | 400700*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 灰狼 优化 算法 差异 代谢物 分析 方法 系统 | ||
一种基于改进灰狼优化算法的差异代谢物分析方法及系统,包括以下步骤:一,获取数据源,其中数据源包括离子的质谱信号数据,对数据进行整合;二,通过哈希算法在数据源获取每个离子所需分析的信息;三,将获取离子的质谱信号数据进行组间对比分析,并根据学生t检验算法以及用户需求的离子评判标准,筛选出所需分析的离子;四,使用改进灰狼优化算法对差异离子进行选择;五,获取差异离子数据,并使用KNN方法进行分类模型建模;六,计算分类模型的混淆矩阵、ROC曲线、AUC面积指标,向用户展示差异分析结果。
技术领域
本发明涉及数据处理领域,具体涉及一种基于改进灰狼优化算法的差异代谢物分析方法及系统。
背景技术
代谢组学是系统生物学领域中继基因组学和蛋白质组学之后新近发展起来的一门学科,它通过检测生物体在受到外源刺激或基因修饰后其体内代谢物质的变化来探索整个生物体的代谢机制。然而,代谢组学研究产生大量的数据,通常具有高维、小样本、高噪声等复杂特征。如何从复杂的代谢组学数据中提取出有价值的信息,筛选出潜在的生物标志物成为近年来代谢组学研究的热点和难点。虽然近年来组学技术的发展加快了生物标志物的鉴定速度,但统计学强度低以及结果再现性率差阻碍了生物标志物的筛选进程、需要收集大量数据才能鉴定出可区分的有效生物标志物,然而,研究人员在数据处理中仍面临着很复杂的挑战。在把机器学习方法应用于差异代谢物分析方面,综合利用了统计学、证据理论、神经网络、模糊集、粗糙集、进化计算等领域的方法,以达完成数据总结、分类规则提取、特征选择、数据聚类、相关性分析发现等任务。
对于差异代谢物分析技术的研究,国内外的科研机构给予了高度的重视,已经进行了大量的研究和探讨。综合国内外的研究现状,传统方法和机器学习的各种算法在差异代谢物分析领域的研究受到国内外学者的广泛关注,但是,由于常用的差异代谢物选择方法存在易丢失数据中的有用信息、通用性不强、计算开销高、与机器学习方法高度绑定的缺点,需要进一步改进。此外,由于传统的代谢组学数据的处理分析方法费时费力,且随着数据处理量呈指数级的增加,所以对代谢组学数据的差异代谢物快速自动化的分析同样也亟待解决。
发明内容
本发明针对现有技术的不足,提出一种基于改进灰狼优化算法的差异代谢物分析方法及系统,旨在解决现有机器学习的各种方法和传统方法对于代谢组学数据中的高维、小样本、高冗余、存在相互作用、分布的不规则和稀疏性等难题,而难以达到较为准确结果且处理流程时间长的问题。具体技术方案如下:
一种基于改进灰狼优化算法的差异代谢物分析方法,包括以下步骤:
步骤一,获取数据源,其中数据源包括离子的质谱信号数据,对数据进行整合;
步骤二,通过哈希算法在数据源获取每个离子所需分析的信息;
步骤三,将获取离子的质谱信号数据进行组间对比分析,并根据学生t检验算法以及用户需求的离子评判标准,筛选出所需分析的离子;
步骤四,使用改进灰狼优化算法对差异离子进行选择;
步骤五,获取差异离子数据,并使用KNN方法进行分类模型建模;
步骤六,计算分类模型的混淆矩阵、ROC曲线、AUC面积指标,向用户展示差异分析结果。
作为优化:所述步骤一中,数据源为自于代谢组学分析平台产生的质谱信号数据。
作为优化:所述步骤二具体为通过哈希算法对整合后的数据进行查询,获取并计算数据中每个离子所需的分析信息,构建分析数据集,具体包括,离子质谱信号强度、离子出现频率、离子色谱峰形得分和同位素离子信息。
作为优化:所述步骤三中将获取离子的质谱信号数据进行组间对比分析,具体为,将出现频率50%以上离子信息作为输入,并根据学生t检验算法以及用户需求的离子评判标准,输出所需分析的离子数据集,学生t检验算法的具体流程为:
检验统计量t计算公式为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南大学,未经西南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111334354.6/2.html,转载请声明来源钻瓜专利网。