[发明专利]一种生物代谢组学数据处理方法、分析方法及装置和应用有效
申请号: | 202111130359.7 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113588847B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 赵丹;李安州;郭磊;刘萌萌;李靖潇;王燕;刘小芬 | 申请(专利权)人: | 萱闱(北京)生物科技有限公司;郑州市第三人民医院 |
主分类号: | G01N30/02 | 分类号: | G01N30/02;G01N30/72;G01N30/86 |
代理公司: | 北京箴思知识产权代理有限公司 11913 | 代理人: | 李春晖 |
地址: | 100006 北京市东城区王府井*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生物 代谢 数据处理 方法 分析 装置 应用 | ||
本发明公开了一种生物代谢组学数据处理方法、分析方法及装置和应用。生物代谢组学数据处理方法包括筛选出多个待测样品中的差异代谢物的步骤,生物代谢组学数据包括待测样品的液相色谱‑质谱数据,筛选的方法包括:(1)对生物代谢组学数据进行预处理和标准化处理,得到二维矩阵数据;(2)缺失峰补齐处理:对所述二维矩阵数据进行稀疏重构处理,再进行降维处理;(3)对步骤(2)得到的数据进行化学计量分析,筛选出待测样品中的差异代谢物。本发明的方法可用于分析不断有新样品增加,样品收集时间长的代谢组学数据,识别和确定差异代谢物的结构,准确度和精度均较高。
技术领域
本发明属于代谢组学技术领域,尤其涉及一种生物代谢组学数据处理方法、分析方法及装置和应用。
背景技术
代谢组学的应用极为广泛,几乎已经渗透到生活的各个方面。尤其是在现代生命科学和医药科学领域,应用更为普遍,其应用范围包括临床医学、药物研发、生物农业、食品安全、环境科学以及生物能源等方面。
在疾病诊断方面,由于机体的病理变化,代谢产物也产生了某种相应的变化,应用代谢组学分析对这些由疾病引起的代谢产物的响应进行分析,可以促进疾病生物标志物的发现以及辅助临床诊断。如代谢组学技术被应用于胃癌、肝癌、前列腺癌、肠癌和心血管疾病等重大疾病方面的研究。
代谢组学的数据处理主要包括原始数据的预处理和多变量数据分析两个步骤,其目的在于揭示生物样品的关键性生物标志物、代谢节点和代谢途径,最终帮助揭示代谢组学的数据分析结果。数据处理是挖掘过程中的重要一步,如果存在许多不相关、冗余的信息、噪声或不可靠的数据,则使得数据训练期间的特征识别更加困难。
LC/MS成为复杂生物样品中分析代谢产物的首选方法,但是基于LC/MS的代谢组学数据,都具有信息量大、维度高以及数据复杂性强等特点,如何处理以及更好地整合代谢组学数据仍然面临着巨大的挑战,比如临床数据收集时间长,分析样本量巨大;为了确定各种生物系统中的生物扰动、分析代谢变化的时间依懒性、以及评估个性化医疗中的治疗效果和高危人群分层,来自大规模代谢学研究中的数据通常收集期可达数月甚至数年之久,并且必须分成多个批次,需要综合考虑各实验批次研究中所得到的全部数据,另外,相对于小样本而言巨大数量的变量所造成的维度灾难,以及当数据分析过程中需要评估大量参数以及测试大量统计假设时,如果样本量过小在估计参数或者测试统计假设上带来的困难,也需要慎重考虑数据整合的重要性和必要性。
目前,通常使用开源程序处理LC/MS代谢组学数据,但是由于这些软件不能对仪器产生的原始数据进行识别,所以需要使用者准备符合软件格式要求的数据,也因此需要使用与仪器配套的软件对原始数据进行处理,直至成为可供分析使用的数据集。当前的一些程序对于整合不同样本和不同批次的代谢组学数据,存在一些问题和局限性,数据处理时间和难度会随样本数增加而增加,不适用于不断有新样本需要测试的代谢组学数据分析,结果的准确度和精度相对较低。
因此,本领域亟需开发一种准确度和精度均较高,且可用于处理不断有新样品增加,样品收集周期较长的代谢组学数据的分析方法。
发明内容
本发明所要解决的技术问题是克服现有技术中在整合不同样本和不同批次的代谢组学数据时,数据处理时间和难度会随样品增加而增加,不适用于不断有新样品需要进行处理的代谢组学数据分析,且现有方法的准确度和精度都较低等缺陷,而提供一种生物代谢组学数据处理方法、分析方法及装置和应用。本发明的生物代谢组学数据处理方法可用于分析不断有新样品增加,样品收集时间长的代谢组学数据,例如结直肠癌高危人群血清成分的代谢组学数据,通过采用液质谱联用(LC-MS)方式检测正常人群和高危人群(腺瘤、癌前病变、癌症)血清样本的代谢组学数据,比较和分析正常人群和患者血清中不同代谢产物的质谱峰,识别和确定差异代谢物的结构,为对差异代谢物的功能和代谢途径的确定提供研究基础,便于进一步判断出不同个体(患者)的病理、生理状态,为后期临床诊断和治疗提供依据。本发明的生物代谢组学数据处理方法的准确度和精度更高。
本发明采用以下技术方案解决上述技术问题:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于萱闱(北京)生物科技有限公司;郑州市第三人民医院,未经萱闱(北京)生物科技有限公司;郑州市第三人民医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111130359.7/2.html,转载请声明来源钻瓜专利网。