[发明专利]一种构建抗生素抗性基因数据库的方法有效

专利信息
申请号: 201810195831.7 申请日: 2018-03-09
公开(公告)号: CN108491692B 公开(公告)日: 2023-07-21
发明(设计)人: 邓晔;魏子艳 申请(专利权)人: 中国科学院生态环境研究中心;中国科学院大学
主分类号: G16B50/10 分类号: G16B50/10;G16B50/30;G16B30/00
代理公司: 北京风雅颂专利代理有限公司 11403 代理人: 张拥
地址: 100085*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了生物技术领域的一种构建抗生素抗性基因数据库的生物信息学方法,该方法包括在基因数据库(GenBank)搜索抗性基因的蛋白序列;选择高度精确的序列作为初始序列;采用ClustalW方法比对;构建隐马尔可夫模型并搜索GenBank蛋白数据库,得到全部包含蛋白保守位点的序列;根据序列的E值和GenBank数据库中序列的注释信息,去除高度同源和不符合要求的序列;删除重复序列后添加物种注释信息;整合所有蛋白序列,完成数据库的构建。该方法能够综合衡量序列的注释信息和比对相似性,提高序列收集的速度和准确性。利用本发明提供的方法,可以完成抗生素抗性基因数据库的构建,为研究抗性基因的引物设计、数据分析和序列注释提供基础数据。
搜索关键词: 一种 构建 抗生素 抗性 基因 数据库 方法
【主权项】:
1.一种构建抗生素抗性基因数据库的方法,其特征在于,包括以下步骤:(1)在基因数据库(GenBank)搜索抗生素抗性基因对应的蛋白序列;(2)选择具有精确注释信息和目标片段长度的无重复蛋白序列作为初始序列;(3)采用ClustalW方法对初始蛋白序列进行多序列比对;(4)以比对完成的序列构建该基因的蛋白保守位点隐马尔可夫模型,搜索GenBank蛋白数据库,得到全部具有该抗性基因蛋白保守位点的蛋白序列;(5)根据搜索结果中序列的E值和GenBank蛋白数据库中序列的注释信息,去除高度同源序列和不符合要求的蛋白序列,其筛选标准如下:①注释信息包含抗性基因名字;②注释信息包含抗性基因产生耐药性的抗生素;③注释信息包含抗性基因产生耐药性的主要作用机制;④注释信息不存在推测蛋白(putative protein)和假定蛋白(hypothetical protein);⑤E值小于1e‑5;在符合④⑤的前提下,符合①或②或③则认为该序列为抗性基因对应的蛋白序列;(6)对筛选得到的蛋白序列删除重复,添加物种注释信息;(7)整合所有蛋白序列,完成抗生素抗性基因数据库的构建。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院生态环境研究中心;中国科学院大学,未经中国科学院生态环境研究中心;中国科学院大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810195831.7/,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top