[发明专利]基于改进灰狼优化算法的差异代谢物分析方法及系统在审
申请号: | 202111334354.6 | 申请日: | 2021-11-11 |
公开(公告)号: | CN114091590A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 潘红宇;陈善雄;曲存民;尹能文;王定旺;李加纳;申树林;唐云山;胡冉;向思柔 | 申请(专利权)人: | 西南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00;G16B20/00 |
代理公司: | 重庆上义众和专利代理事务所(普通合伙) 50225 | 代理人: | 郭维 |
地址: | 400700*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 改进 灰狼 优化 算法 差异 代谢物 分析 方法 系统 | ||
1.一种基于改进灰狼优化算法的差异代谢物分析方法,其特征在于,包括以下步骤:
步骤一,获取数据源,其中数据源包括离子的质谱信号数据,对数据进行整合;
步骤二,通过哈希算法在数据源获取每个离子所需分析的信息;
步骤三,将获取离子的质谱信号数据进行组间对比分析,并根据学生t检验算法以及用户需求的离子评判标准,筛选出所需分析的离子;
步骤四,使用改进灰狼优化算法对差异离子进行选择;
步骤五,获取差异离子数据,并使用KNN方法进行分类模型建模;
步骤六,计算分类模型的混淆矩阵、ROC曲线、AUC面积指标,向用户展示差异分析结果。
2.根据权利要求1所述基于改进灰狼优化算法的差异代谢物分析方法,其特征在于:所述步骤一中,数据源为自于代谢组学分析平台产生的质谱信号数据。
3.根据权利要求1所述基于改进灰狼优化算法的差异代谢物分析方法,其特征在于:所述步骤二具体为通过哈希算法对整合后的数据进行查询,获取并计算数据中每个离子所需的分析信息,构建分析数据集,具体包括,离子质谱信号强度、离子出现频率、离子色谱峰形得分和同位素离子信息。
4.根据权利要求1所述基于改进灰狼优化算法的差异代谢物分析方法,其特征在于:所述步骤三中将获取离子的质谱信号数据进行组间对比分析,具体为,将出现频率50%以上离子信息作为输入,并根据学生t检验算法以及用户需求的离子评判标准,输出所需分析的离子数据集,学生t检验算法的具体流程为:
检验统计量t计算公式为
假设检验的过程:
作出假设,把想要拒绝的情况作为零假设;
想要接受的情况作为备择假设;
计算检验统计量t;
根据所要求的置信系数α以及自由度查表确定tα等临界值;
如果检验统计量落入了临界值之外,则拒绝零假设,结论发生错误的概率为α,否则没有足够的理由拒绝零假设。
5.根据权利要求1所述基于改进灰狼优化算法的差异代谢物分析方法,其特征在于:所述步骤四中,改进的灰狼优化算法具体包括:输入所需分析的离子数据集,调用改进的灰狼优化算法对差异离子进行选择,输出差异粒子数据集。
6.根据权利要求1所述基于改进灰狼优化算法的差异代谢物分析方法,其特征在于:步骤五中,获取差异粒子数据集,使用KNN方法建立分类模型;步骤六中,根据所建立的分类模型,使用10-fold cross-validation对筛选离子进行评估,具体包括:混淆矩阵、ROC曲线和AUC面积指标。
7.根据权利要求1-6任一权利要求所述基于改进灰狼优化算法的差异代谢物分析方法的系统,其特征在于:设置有数据采集及整合单元,获取代谢组学分析平台上所获得离子的质谱信号数据,并进行数据整合;
信息获取单元,用于使用哈希算法获取数据中每个离子所需的分析信息,并进行组间数据对比分析,构建所需分析的离子数据集;
差异分析单元,用于使用改进灰狼优化算法对差异离子进行选择,获取差异离子数据集,并使用KNN算法对差异离子数据集构建分类模型,最后根据分类效果对差异离子的选择进行评估。
8.根据权利要求7所述基于改进灰狼优化算法的差异代谢物分析方法的系统,其特征在于:所述数据采集及整合单元具体为:
数据采集模块,获取代谢组学分析平台上所获得离子的质谱信号数据;
数据整合模块,用于将获取到的各个时间段各个样本的数据进行整合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南大学,未经西南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111334354.6/1.html,转载请声明来源钻瓜专利网。