[发明专利]LC-MS下机数据的处理方法及处理装置在审
申请号: | 202111499762.7 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114200048A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 于快;时展;李灏晖;彭兴;李琰 | 申请(专利权)人: | 深圳脉图精准技术有限公司 |
主分类号: | G01N30/02 | 分类号: | G01N30/02;G01N30/86 |
代理公司: | 北京尚诚知识产权代理有限公司 11322 | 代理人: | 季向冈;鲁兵 |
地址: | 518057 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | lc ms 下机 数据 处理 方法 装置 | ||
1.一种LC-MS下机数据的处理方法,所述方法包括以下步骤:
S1:读取LC-MS的下机数据、制作上机序列集(正模式B1和负模式B2)及参数文件,转换下机数据的一级全扫描图谱信息对每个数据进行解卷积并扣除背景基线,获得正模式数据集(A1)和负模式数据集(A2);
S2:针对步骤S1获得的正模式数据集(A1)和负模式数据集(A2),用至少一种方式校正每个样本间的保留时间漂移,再将每个样本内的色谱峰与参考数据库内的参考化合物特征进行匹配,将匹配上的化合物的色谱峰归为正模式靶向数据集(C1、C2、C3)和负模式靶向数据集(C4、C5、C6);另将剩余未能匹配成功的色谱峰进行样本间的峰匹配,归为非靶向数据集(D1-D6);
S3:对步骤S2不同方式下获得的正模式靶向数据集和负模式靶向数据集(C1和C4,C2和C5,C3和C6)的化合物分别进行匹配审查,按照只保留主要加合离子峰的原则扣除次要加合离子峰,并进行冲突化合物审查,对冲突化合物合并或过滤,针对不同方式分别建立靶向合并数据集(E1、E2和E3);
S4:当进行了多种方式的保留时间校正时,对步骤S3获得的靶向合并数据集(E1、E2和E3)中不同方式下同一色谱峰在不同样本内的强度进行比较,保留在每个样本中的最高强度和化合物信息,建立平台靶向数据集(F);
S5:将步骤S2和S3中获得的其中一种方式下产生的非靶向数据集和靶向合并数据集合并,计算两两色谱峰之间的相关性,保留低于相关性阈值的非靶向色谱峰,与步骤S4中得到的平台靶向数据集(F)合并,获得去冗余数据集(G);
S6:对步骤S5获得的去冗余数据(G)进行缺失值填充处理后进行批次效应校正,再进行数据归一化,然后进行标准化转换,得到鉴定出化合物的、去除了批次效应的代谢组数据集(H)。
2.如权利要求1所述的处理方法,其特征在于,
在步骤S1中,批量将下机数据RAW文件转换为BINARY文件,再将BINARY文件再转化为HDF5文件。
3.如权利要求1或2所述的处理方法,其特征在于,
在步骤S2中,所述方式包括下述方式一至方式三中的至少一种:
方式一:参照样本的校正与化合物识别;
方式二:内部校准的校正与化合物识别;
方式三:不进行保留时间校正的化合物识别。
4.如权利要求1-3的任一项所述的处理方法,其特征在于,
步骤S2中将色谱峰与参考化合物特征进行匹配的方法包括以下步骤:1)对每个样本里的每个色谱峰,都与参考数据库中参考化合物不同加合离子的参考保留时间和参考质荷比进行匹配,其中,允许的质量精度偏差和保留时间窗口由用户自定义;2)计算每个加合离子的样本检出数、平均保留时间、平均质荷比和平均离子强度,并与参考保留时间、参考质荷比和参考离子强度进行对比。
5.如权利要求1-4的任一项所述的处理方法,其特征在于,
步骤S2中对剩余色谱峰进行样本间的峰匹配的方法,是将所有色谱峰在样本间进行两两对比,将在设定的质量精度偏差(如5ppm)以内和保留时间偏差(如0.03分钟)以内的峰作为同一化合物在不同样本间检测出的峰,归为同一个非靶向色谱峰。
6.如权利要求1-5的任一项所述的处理方法,其特征在于,
步骤S3中审查化合物匹配结果的方法,按参考化合物主要加合离子和各次要加合离子之间的关系,与样本中与之匹配的色谱峰组合间的关系进行比较,如果关系相似,认为是正确的化合物匹配结果,按照只保留主要加合离子峰的原则扣除次要加合离子峰;如果关系不相似,则认为是错误的匹配结果,此色谱峰组合归入未能匹配成功的色谱峰矩阵;
其中,关系相似至少需要满足以下条件:1)匹配到了主要加合离子,该离子峰在所有加合离子峰中强度最高;2)匹配到了第二加合离子或者第三加合离子,该离子峰的保留时间与主要加合离子峰的保留时间偏差在设定时间(如0.01分钟)以内,且该离子峰的强度与主要加合离子峰强度的比值和参考化合物该次要加合离子峰与参考化合物主要加合离子峰强度的比值近似(如两个比值偏差在0.1以内);3)主要加合离子的检出样本数要不低于次要加合模式的检出样本数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳脉图精准技术有限公司,未经深圳脉图精准技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111499762.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置