[发明专利]一种基于抗性基因及毒力因子基因评价水体健康风险的方法在审
| 申请号: | 202010684761.9 | 申请日: | 2020-07-16 |
| 公开(公告)号: | CN111944914A | 公开(公告)日: | 2020-11-17 |
| 发明(设计)人: | 柏耀辉;王巧娟;梁金松;廖恺玲俐;曲久辉 | 申请(专利权)人: | 中国科学院生态环境研究中心 |
| 主分类号: | C12Q1/689 | 分类号: | C12Q1/689;C12Q1/6869;C12Q1/04;G16B20/00;G16B30/10 |
| 代理公司: | 北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617 | 代理人: | 郭晓迪 |
| 地址: | 100085*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 抗性 基因 毒力 因子 评价 水体 健康 风险 方法 | ||
1.一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述方法包括如下步骤:
(1)采集水体样品,提取获得样品的宏基因组测序数据,并对原始测序数据raw reads进行质量过滤,得到高质量读段clean reads;
(2)对每个样品获得的clean reads进行组装,获得重叠群contigs;
(3)根据contigs的核酸组成和丰度变化模式,对序列进行聚类、分箱,得到微生物基因组草图MAGs,对所有的MAGs根据完整度和污染率进行评估,选择出符合要求的高质量代表性MAGs,对高质量代表性MAGs进行去冗余,获得非冗余MAGs集;
(4)对所述非冗余MAGs集的所有contigs预测开放阅读框ORF,将所有ORF依次与抗生素抗性基因数据库和毒力因子数据库比对,识别出同时含有ARG序列和VFG序列的MAGs即定义为潜在的PARB,并统计这些潜在的PARB携带的ARG和VFG的种类及数量;
(5)样品中属于潜在的PARB的MAGs丰度的计算:使用基于映射的方法获得每个样品中能与非冗余MAGs集中所有MAGs成功比对上的reads的数目占该样品reads总数的百分比,以及非冗余MAGs集中每个MAG在各个样品中的覆盖度,每个样品中每个PARB的丰度根据公式(1)计算:
其中,样品中reads映射的百分比代表一个样品中能与非冗余MAGs集成功比对上的reads的数目占该样品reads总数的百分比,单个PARB覆盖度即一个属于潜在的PARB的MAG在一个样品中的覆盖度,所有MAG覆盖度之和代表所有MAGs在一个样品中的覆盖度之和;
(6)单个PARB健康风险率的计算:将步骤(4)得到的每个PARB携带的ARGs的数量、ARGs的类型、VFGs的数量和VFGs的类型数据,利用主成分分析的方法,获得一个主成分,并对该主成分的值进行归一化,归一化后的各个PARB主成分的值即为各个PARB的健康风险率;
(7)水体健康风险的计算:PARB的健康风险率与各个采样点PARB丰度乘积之和即可代表水体健康风险水平。
2.根据权利要求1所述的一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述步骤(3)中对所有的MAGs根据完整度和污染率进行评估,根据完整度60%、污染率10%选择高质量代表性MAGs。
3.根据权利要求1所述的一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述步骤(4)中所述抗生素抗性基因数据库使用ARGs_OAP_v2.0,所述毒力因子数据库使用VFDB。
4.根据权利要求1所述的一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述步骤(4)中所有ORF依次与抗生素抗性基因数据库和毒力因子数据库比对,符合相似度80%、长度top hit的70%的条件即被认为是潜在的ARG序列或VFG序列。
5.根据权利要求1所述的一种基于抗性基因及毒力因子基因评价水体健康风险的方法,其特征在于,所述步骤(6)中利用R语言进行主成分分析和归一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院生态环境研究中心,未经中国科学院生态环境研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010684761.9/1.html,转载请声明来源钻瓜专利网。





