[发明专利]LC-MS下机数据的处理方法及处理装置在审
申请号: | 202111499762.7 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114200048A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 于快;时展;李灏晖;彭兴;李琰 | 申请(专利权)人: | 深圳脉图精准技术有限公司 |
主分类号: | G01N30/02 | 分类号: | G01N30/02;G01N30/86 |
代理公司: | 北京尚诚知识产权代理有限公司 11322 | 代理人: | 季向冈;鲁兵 |
地址: | 518057 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | lc ms 下机 数据 处理 方法 装置 | ||
本发明提供一种LC‑MS下机数据的处理方法及处理装置。处理方法包括:获取LC‑MS下机数据及参数文件并对数据进行转换的步骤;校正保留时间并进行色谱峰匹配的步骤;扣除次要加合离子峰并过滤冲突化合物的步骤;对互补峰进行合并的步骤;计算色谱峰之间的相关性的步骤;以及进行批次效应校正和标准化转换的步骤。采用上述方法,能够一次输入数百乃至数千个样本的LC‑MS下机数据,获得鉴定出尽可能多化合物的、去除批次效应的、去冗余的、可直接用于后续统计学分析的代谢组数据集。
技术领域
本发明涉及分析化学领域的数据处理技术,特别是涉及一种对样本经LC-MS(液相色谱质谱联用仪)分析得到的下机数据进行处理获得代谢组数据集的方法及装置。
背景技术
代谢组学(metabolomics)是涉及代谢产物的化学过程的科学研究。具体而言,代谢组学是对特定的细胞过程遗留下的特殊化学指纹,即对它们的小分子代谢产物的整体研究。代谢组(metabolome)定义为在一个生物细胞、组织、器官或生物体中所有的代谢产物(化合物)的集合。
液相色谱质谱联用仪(LC-MS)因其卓越的灵敏度和广泛的覆盖范围成为代谢组学研究中常用的技术平台,通过它能快速而极为准确地鉴定生物小分子化合物。
LC-MS的高灵敏度导致对下机数据的处理相当复杂,主要的困难或陷阱包含以下几个方面:峰识别、峰积分(峰积分的目标是获得这些色谱峰的保留时间、高度和面积)、保留时间校正、加合离子去除、去除噪音和批次效应去除。目前的代谢组质谱数据处理方式多种多样,然而,对于以上提及困难的解决方法没有一致的标准,这就导致不同的处理方法获得的代谢组数据不同,降低了可比性与可信度。
色谱峰保留时间应具有高度可重复性,以便在样品之间准确选择峰。然而,给定代谢物(指同一化合物)的峰保留时间通常可能在相同检测条件不同检测批次中略有变化,可能是由色谱柱老化、样品过载、流动相pH值不稳定以及色谱柱温度和压力变化引起的。而且,即便在同一个样本中,不同的化合物对上述影响因素的反应不同,从而导致峰保留时间漂移的程度不同。所有这些在分析过程中都很难严格控制,尤其是在涉及数百或数千个样本的大规模代谢组学研究中。因此,保留时间的对齐是数据预处理中的一个重要步骤,以确保来自不同样品和不同检测批次中相同代谢物的峰对齐到相同的保留时间从而指向相同的代谢物或成分(化合物)。
LC-MS技术的高通量加上对大型实验的需求导致数据预处理,即跨样品的代谢物量化,成为主要瓶颈。目前市面上也有许多商用或非商用的数据处理软件,如CompoundDiscoverer,MSDIAL等。但是,现有软件最大的限制是单次处理的最大样本量受限,单次只能处理数十个样本,且极其耗费计算资源。对于数百甚至数千样本量的大型项目,必须分批次处理质谱数据,耗费极大的人力与时间成本。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种高通量的代谢组LC-MS下机数据的处理方法及装置。
为实现上述目的及其他相关目的,本发明第一方面提供一种液相色谱质谱联用仪数据的处理方法,所述方法至少包括以下步骤:
S1:读取LC-MS的下机数据、制作上机序列集(正模式B1和负模式B2)及参数文件,转换下机数据的一级全扫描图谱信息对每个数据进行解卷积并扣除背景基线,获得正模式数据集(A1)和负模式数据集(A2)。
S2:针对步骤S1获得的正模式数据集(A1)和负模式数据集(A2),用至少一种方式校正每个样本间的保留时间漂移,再将每个样本内的色谱峰与参考数据库内的参考化合物特征进行匹配,将匹配上的化合物的色谱峰归为正模式靶向数据集(C1、C2、C3)和负模式靶向数据集(C4、C5、C6);另将剩余未能匹配成功的色谱峰进行样本间的峰匹配,归为非靶向数据集(D1-D6)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳脉图精准技术有限公司,未经深圳脉图精准技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111499762.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置