[发明专利]蛋白组临床生物标志物整体筛选方法、系统和介质在审
| 申请号: | 202210176248.8 | 申请日: | 2022-02-24 |
| 公开(公告)号: | CN114550832A | 公开(公告)日: | 2022-05-27 |
| 发明(设计)人: | 赵海义;华权高;李云;舒芹;张韦 | 申请(专利权)人: | 武汉金开瑞生物工程有限公司 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00;G06N20/20 |
| 代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 姜婷 |
| 地址: | 430000 湖北省武汉市东湖开发区高新大道*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 蛋白组 临床 生物 标志 整体 筛选 方法 系统 介质 | ||
1.一种蛋白组临床生物标志物整体筛选方法,其特征在于,包括以下步骤:
获取高通量蛋白组的检测数据,并对所述检测数据进行数据预处理;
对所述预处理后的所述检测数据进行蛋白组学的特征预筛选,得到蛋白组学的有效特征集;
对所述有效特征集进行特征提取得到候选蛋白标志物组合;
使用多种机器学习特征选择方法对所述候选蛋白标志物组合进行筛选得到生物标志物。
2.根据权利要求1所述的一种蛋白组临床生物标志物整体筛选方法,其特征在于,还包括步骤:
计算所述生物标志物在经典模型中的重要性指数、表达丰度和相关性指数;
根据所述重要性指数、所述表达丰度和所述相关性指数计算得到所述生物标志物的分类能力指数。
3.根据权利要求2所述的一种蛋白组临床生物标志物整体筛选方法,其特征在于,还包括步骤:
使用逻辑回归算法构建所述生物标志物的诊断模型;
利用所述诊断模型对所述高通量蛋白组的所述检测数据进行ROC分析。
4.根据权利要求1所述的一种蛋白组临床生物标志物整体筛选方法,其特征在于,所述对所述检测数据进行数据预处理,包括步骤:
根据每个检测数据样本的缺失值情况进行缺失值删除或插补处理;
将所述检测数据进行标准化处理;
对不同批次的所述检测数据进行批次校正。
5.根据权利要求1所述的一种蛋白组临床生物标志物整体筛选方法,其特征在于,所述对所述检测数据进行蛋白组学的特征预筛选,包括步骤:
使用单因素统计分析方法对所述检测数据进行蛋白组学的特征预筛选,以保存有效的所述特征变量。
6.根据权利要求4所述的一种蛋白组临床生物标志物整体筛选方法,其特征在于,所述根据每个所述检测数据样本的缺失值情况进行缺失值删除或插补处理,包括步骤:
生存缺失报告,查看每个所述检测数据样本所检测出的蛋白表达量的缺失情况;
若所述检测数据样本的缺失情况达到50%以上,将所述检测数据样本删除;
若所述检测数据样本的缺失情况小于50%,将所述检测数据样本缺失值的最邻值插补到所述缺失值。
7.根据权利要求1所述的一种蛋白组临床生物标志物整体筛选方法,其特征在于,所述使用多种机器学习特征选择方法对所述候选蛋白标志物组合进行筛选得到生物标志物,包括步骤:
将所述候选蛋白标志物组合按比例分为训练集和测试集,使用机器学习模型对所述候选蛋白标志物组合进行筛选得到多种物质,根据各物质对所述机器学习模型的影响强度,选择排名靠前的物质作为所述生物标志物的组合。
8.根据权利要求7所述的一种蛋白组临床生物标志物整体筛选方法,其特征在于,所述训练集和所述测试集的比例为8比2。
9.一种蛋白组临床生物标志物整体筛选系统,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的蛋白组临床生物标志物整体筛选方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至8中任意一项所述的蛋白组临床生物标志物整体筛选方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉金开瑞生物工程有限公司,未经武汉金开瑞生物工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210176248.8/1.html,转载请声明来源钻瓜专利网。





