[发明专利]一种针对目标生物的目标基因建立系统进化树的方法无效
申请号: | 200910158233.3 | 申请日: | 2009-07-23 |
公开(公告)号: | CN101962671A | 公开(公告)日: | 2011-02-02 |
发明(设计)人: | 王颖 | 申请(专利权)人: | 王颖 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 322000 浙江省义乌*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 目标 生物 基因 建立 系统 进化 方法 | ||
技术领域
本发明涉及遗传信息分析方法,特别是涉及系统进化树的建立方法。
背景技术
在对生物进化和系统分类进行研究时,常用一种树状分枝的图型来表示各种生物之间的亲缘关系,这种树状分枝的图型被称为系统进化树(phylogenetic tree,也叫系统发育树),简称系统树。通过比较生物大分子序列差异的数值来构建的系统树称为分子系统树。系统进化树分枝的末端和分枝的连结点称为结,表示生物类群,分枝末端的结代表仍生存的种类。系统进化树可以有时间比例,或者用结之间的分枝长度变化来表现序列的差异值。系统进化树有无根树和有根树(rooted tree)两种形式之分。前者只表示生物类群之间的系统进化关系,不反映进化途径;而后者不仅表示出生物之间的亲疏,而且反映出它们有共同的起源及进化方向。构建有根的系统进化树是相当困难的,例如,连结4种生物的无根树只有3种可能,而有根树则存在15种可能。
构建分子系统(进化)树,是在进行序列测定获得原始序列资料后,由计算机排序,使各分子的序列同源位点对应,并计算出相似性或进化距离。接着,使用计算机软件根据各分子序列的相似性或进化距离构建系统进化树。计算机分析系统采用进化相关性构建系统树时,可以有诸多方法,其中常用有最节省分析法或称简约法。这种方法推断谱系的原理是:在所有可能的谱系关系中,涉及进化改变的序列特征数最少的谱系是最可信的。因此,在比较过程中要找到比较决定性的分子序列。这种分析方法是基于“进化变化的发生是沿着最短的途径、发生最少的、变化从祖先进化成今天所比较的生物种类”这一假设。
伍斯(1981年)等提出了一个函盖整个生命界的有根系统进化树,而后又进行了多次修改和补充,该系统进化树勾画了生物进化的大致轮廓。根部的结代表地球上最先出现的生物,为现有生物的共同祖先。从该系统进化树所反映的进化关系可以看出,真核生物离共同祖先最远,它们是进化程度最高的生物种类。
在目前的分子生物领域的研究中,随着不同物种遗传信息尤其是基因组和蛋白组测序的快速发展,产生了大量的DNA和蛋白序列信息,因此非常需要一种简便而快速的分析方法来对这些数据进行有效的分析,以提取其中包含的大量信息,用于对目标生物的目标基因进行研究。其中,建立系统进化树是众多方法中最为常见的分析方法之一。
目前,关于系统进化树的研究主要集中在软件的开发及其与数据库的接合,现有的系统进化树建立方法多基于软件功能的强化和多阈值优化组合设定,而缺少从生物亲缘关系和数据库优化利用的角度来改进系统进化树的建立方法。
发明内容
为了解决上述问题,本发明人提出了一种改进的针对目标生物的目标基因建立系统进化树的方法,所述方法包括如下步骤:
1)数据的获取;
2)序列的比对和分析;和
3)系统进化树的构建;
其中,在所述第1)步骤中,下载所述目标蛋白的结构域,通过基因组或蛋白组已经测序完成的生物蛋白数据库搜索获取含有所述结构域的序列,并使用基因组或蛋白组已经测序完成的生物的目标基因搜索近缘植物的蛋白序列。
在一个优选的方案中,所述目标生物为植物。
在一个优选的方案中,所述植物为开花植物。
在一个优选的方案中,所述开花植物为青花菜(Brassica oleraceaL.var.italica P.),并且所述近缘植物为拟南芥、大白菜和/或油菜。
优选的是,在第1)步骤中,所述结构域从Pfam网站上下载。
优选的是,在第1)步骤中,所述生物蛋白数据库为NCBI蛋白数据库和/或开花植物EST库(The Floral Genome Project,http://fgp.bio.psu.edu/),选择阈值为阈值E1e-5。
优选的是,所述第2)步骤采用Clustal X1.83软件以默认参数进行。
优选的是,在所述第2)步骤中,还包括手工校对修正所述结构域两侧的比对结果和去除缺口(gap)序列,更优选包括统计保守位点和变异区。
更优选的是,所述第3)步骤采用MEGA4.0软件的邻接法(neighbor-joining tree)构建。
由于本发明方法包括上述第1)至3)步骤,而且从物种亲缘关系和基因组或蛋白组完成测序的数据库两方面予以结合考虑,因此可以建立更加准确的系统进化树,从而可以为今后基因功能的验证提供更具有价值的参考。
附图说明
图1植物CesA基因编码氨基酸序列保守区QVLRW的多重比对结果,箭头所示为保守区QVLRW;和
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王颖,未经王颖许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910158233.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:栅结构及其制造方法
- 下一篇:一种确定网元间拓扑关系的方法及系统