[发明专利]一种数据库系统的建立及其应用在审
| 申请号: | 202111635764.4 | 申请日: | 2021-12-28 |
| 公开(公告)号: | CN116364294A | 公开(公告)日: | 2023-06-30 |
| 发明(设计)人: | 傅博;韩嘉宸 | 申请(专利权)人: | 上海固容生物科技有限公司 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/30;G16H50/20;G06F16/215;G06N20/10 |
| 代理公司: | 上海尚宝律师事务所 31372 | 代理人: | 张力允;张宏佐 |
| 地址: | 201802 上海市嘉*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据库 系统 建立 及其 应用 | ||
本发明涉及一种数据库系统的建立的方法,其包括以下步骤:步骤一、使用分析仪器对生物液体活检样本进行检测,获取实验室生成的fid原始数据文件;步骤二、使用软件将数据文件转化为可以处理的数据文件;步骤三、使用数据转换方法对可处理的数据进行处理;步骤四、根据样本特征数据情况分析判断本次实验进行QC,判断是否满足数据要求;步骤五、如满足数据要求,则对样本特征数据进行数据清洗;步骤六、使用算法对处理过的特征数据进行数据建模预测,并筛选出关键的峰以及其丰度数据;步骤七、事先使用带有准确人工标注的数据,用于机器学习模型的训练;步骤八、将筛选所得的数据输入预训练好的机器学习模型,并给出相应的预测结果以辅助临床诊断。
技术领域
本发明涉及解决质谱仪、光谱仪、气相色谱仪或液相色谱仪等分析仪器对生物液体活检样本中的蛋白组学、多肽组学和代谢组学等检测结果的数据处理的方法。
背景技术
在体外诊断领域,疾病的发展过程总是体现出蛋白、多肽以及代谢产物的异常。例如,在癌症患者血清中,有些多肽持续保持很低水平(如各种癌症患者中所有的FPA片段和乳腺癌患者中3C3f片段),有的则呈高水平(如膀胱癌和前列腺癌中的几种C3f片段和乳腺癌中的一种FPA片段)。从数据分析的角度,我们需要获取这些检测对象的各种属性,然后归一化为等长的特征向量,最后再采用各种计算手段进行分析,以便识别出肿瘤、冠心病等疾病的标志物,进而对疾病进行诊断。在这个过程中,标志物的提取尤其重要,直接影响到诊断结果的准确性。
实验数据处理是一种广泛应用于生产和科学研究过程中的普遍使用的科学计算方法,是产品设计质量管理和科学研究的重要工具。通过特殊的计算手段,对光谱、色谱以及质谱等检测方法得到的数据进行分析,可快速判断出肿瘤、冠心病、高血压及糖尿病等慢性疾病的标志物。
发明内容
为了通过严密而准确的数据处理,对所得的实验数据进行分析,寻找出事物的内在规律,为慢性疾病的诊断提供依据,本发明提供了一种解决质谱仪、光谱仪、气相色谱仪或液相等分析仪器对生物液体活检样本中的蛋白组学、多肽组学和代谢组学等检测结果的数据处理的方法。
具体而言,本发明包含以下实施方式。
1.一种数据库系统的建立的方法,其包括以下步骤:
步骤一、使用分析仪器对生物液体活检样本进行检测,获取实验室生成的fid原始数据文件;
步骤二、使用CompassXport软件将fid数据文件转化为可以处理的数据文件;
步骤三、使用数据转换方法对上述可处理的数据进行处理,以获得各组分准确的相对丰度;
步骤四、根据样本特征数据情况分析判断本次实验进行QC,判断是否满足数据要求,如不满足,分析原因,重新实验;
步骤五、如满足数据要求,则对样本特征数据进行数据清洗;
步骤六、使用算法对处理过的特征数据进行数据建模预测,并筛选出关键的峰以及其丰度数据;
步骤七、事先使用带有准确人工标注的数据,用于机器学习模型的训练;
步骤八、将筛选所得的数据输入预训练好的机器学习模型,并给出相应的预测结果以辅助临床诊断。
2.根据权利要求1所述数据库系统的建立的方法,其中,
在步骤一中,所述分析仪器为质谱仪、光谱仪、气相色谱仪或液相色谱仪。
3.根据权利要求1所述数据库系统的建立的方法,其中,
步骤一中,所述生物液体活检样本选自血清、尿液、组织液、唾液、血浆和关节液中的任一种。
4.根据权利要求1所述数据库系统的建立的方法,其中,在步骤二中,为了提高数据转化的效率,采用多进程处理的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海固容生物科技有限公司,未经上海固容生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111635764.4/2.html,转载请声明来源钻瓜专利网。





