[发明专利]一种基于密码子模板的真核生物功能基因序列搜索方法有效
申请号: | 201710610516.1 | 申请日: | 2017-07-18 |
公开(公告)号: | CN107480473B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王珣;宋弢;朱虎 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266000 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密码子 模板 生物 功能 基因 序列 搜索 方法 | ||
本发明提出了一种基于密码子模板的真核生物功能基因序列搜索方法,通过蛋白质反推出mRNA,然后利用mRNA在生物全基因组序列中搜索出负责调控蛋白质合成的基因序列。本发明的方法实现了在外显子中插入内含子,从而实现了真正意义上的蛋白质调控基因的恢复,可以有效的在全基因组序列中定位出蛋白质调控序列的位置和长度,为下一步通过基因实现对该蛋白质的调控提供了理论基础。
技术领域
本发明涉及基因技术领域,特别涉及一种基于密码子模板的真核生物功能基因序列搜索方法。
背景技术
真核生物的功能基因序列由外显子和内含子两部分交叉组成。在翻译成蛋白质的过程中,内含子被切除掉,外显子连接在一起形成mRNA。最终由mRNA指导蛋白质的合成,这个过程是按照mRNA到蛋白质的密码子表对应完成的。
随着二代生物基因组测序技术的发展,对生物蛋白质产物的调控集中到了基因层面。基于以上蛋白质形成过程,如果可以在生物全基因组中找到调控蛋白质合成的那段基因,则可以通过对该段基因的调节,实现对蛋白质产物的控制。
以往该方面的科学研究,多由生物的全基因组序列着手,通过对全基因组序列的直接挖掘找出调控蛋白质的基因。
通过对生物全基因组数据直接挖掘的方法发现蛋白质调控基因,这种方法无异于大海捞针。这是由于生物全基因组序列数据的海量性,加之蛋白质调控基因相对而言比较短小,并且蛋白质调控基因在全基因组中并无明显标志性特点。目前成功的基因挖掘工作,都是在全基因组数据挖掘的基础上,通过生物同属同科间保守序列的比对,来确定疑似蛋白质调控基因,然后通过基因敲除实验,验证该疑似蛋白质调控基因的真伪。这种研究方法有两个显著缺点:
(1)针对某种生物的研究,需要建立在该生物的同属同科生物基因已被充分挖掘的基础上,否则,无法通过同属同科生物间的保守序列比对确定疑似基因。这就使得研究只能针对某些已有大量研究基础的“热门”生物,而这种研究基础本身也需要多年的积累,显然这种研究模式已经不适用于当今多物种的高通量生物基因组数据研究。
(2)通过生物同属同科间保守序列的比对来确定疑似蛋白质调控基因,这种方法本身就存在很大的误差,有可能出现多个疑似调控基因的序列,这就需要进一步通过生物实验的方式,逐一验证并最终确定调控基因。这不但使得研究成本提高,研究周期加长,同时也会由于实验操作准确性等问题,造成研究结果的误差。
发明内容
针对上述现有技术中存在的不足,本发明提出了一种基于密码子模板的真核生物功能基因序列搜索方法。
本发明的技术方案是这样实现的:
一种基于密码子模板的真核生物功能基因序列搜索方法,通过蛋白质反推出mRNA,然后利用mRNA在生物全基因组序列中搜索出负责调控蛋白质合成的基因序列。
可选地,在已知蛋白质氨基酸的构成和顺序的基础上,利用氨基酸密码子表,反推出mRNA,完成对mRNA的复原。
可选地,在mRNA的复原过程中,对氨基酸密码子表做以下处理:
令X={U,C,A,G},X是U,C,A,G四个碱基中的任意一个;同理,令Y={U,C},Z={A,G},Y是U,C两个碱基中的任意一个,Z是A,G两个碱基中的任意一个;精简mRNA的编码形式。
可选地,利用mRNA寻找DNA序列中蛋白质调控基因的过程,具体步骤如下:
步骤1,取一条mRNA序列与DNA序列从头开始做比对;
步骤2,在DNA序列中所有与mRNA序列重合的部分中,选取最长的那一条,作为蛋白质调控基因中第一个外显子的序列,并且将mRNA序列中相应的部分截断去除;
步骤3,在DNA序列中,从第一个外显子之后的位置开始,继续按照步骤1、步骤2移动比对,直到找到所有外显子;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710610516.1/2.html,转载请声明来源钻瓜专利网。