[发明专利]一种构建抗生素抗性基因数据库的方法有效
申请号: | 201810195831.7 | 申请日: | 2018-03-09 |
公开(公告)号: | CN108491692B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 邓晔;魏子艳 | 申请(专利权)人: | 中国科学院生态环境研究中心;中国科学院大学 |
主分类号: | G16B50/10 | 分类号: | G16B50/10;G16B50/30;G16B30/00 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 张拥 |
地址: | 100085*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了生物技术领域的一种构建抗生素抗性基因数据库的生物信息学方法,该方法包括在基因数据库(GenBank)搜索抗性基因的蛋白序列;选择高度精确的序列作为初始序列;采用ClustalW方法比对;构建隐马尔可夫模型并搜索GenBank蛋白数据库,得到全部包含蛋白保守位点的序列;根据序列的E值和GenBank数据库中序列的注释信息,去除高度同源和不符合要求的序列;删除重复序列后添加物种注释信息;整合所有蛋白序列,完成数据库的构建。该方法能够综合衡量序列的注释信息和比对相似性,提高序列收集的速度和准确性。利用本发明提供的方法,可以完成抗生素抗性基因数据库的构建,为研究抗性基因的引物设计、数据分析和序列注释提供基础数据。 | ||
搜索关键词: | 一种 构建 抗生素 抗性 基因 数据库 方法 | ||
【主权项】:
1.一种构建抗生素抗性基因数据库的方法,其特征在于,包括以下步骤:(1)在基因数据库(GenBank)搜索抗生素抗性基因对应的蛋白序列;(2)选择具有精确注释信息和目标片段长度的无重复蛋白序列作为初始序列;(3)采用ClustalW方法对初始蛋白序列进行多序列比对;(4)以比对完成的序列构建该基因的蛋白保守位点隐马尔可夫模型,搜索GenBank蛋白数据库,得到全部具有该抗性基因蛋白保守位点的蛋白序列;(5)根据搜索结果中序列的E值和GenBank蛋白数据库中序列的注释信息,去除高度同源序列和不符合要求的蛋白序列,其筛选标准如下:①注释信息包含抗性基因名字;②注释信息包含抗性基因产生耐药性的抗生素;③注释信息包含抗性基因产生耐药性的主要作用机制;④注释信息不存在推测蛋白(putative protein)和假定蛋白(hypothetical protein);⑤E值小于1e‑5;在符合④⑤的前提下,符合①或②或③则认为该序列为抗性基因对应的蛋白序列;(6)对筛选得到的蛋白序列删除重复,添加物种注释信息;(7)整合所有蛋白序列,完成抗生素抗性基因数据库的构建。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院生态环境研究中心;中国科学院大学,未经中国科学院生态环境研究中心;中国科学院大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810195831.7/,转载请声明来源钻瓜专利网。
- 上一篇:亲缘关系鉴定方法及终端设备
- 下一篇:一种基于等差递变的加密防伪印刷方法