[发明专利]一种基于密码子模板的真核生物功能基因序列搜索方法有效
申请号: | 201710610516.1 | 申请日: | 2017-07-18 |
公开(公告)号: | CN107480473B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王珣;宋弢;朱虎 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266000 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密码子 模板 生物 功能 基因 序列 搜索 方法 | ||
1.一种基于密码子模板的真核生物功能基因序列搜索方法,其特征在于,通过蛋白质反推出mRNA,然后利用mRNA在生物全基因组序列中寻找出负责调控蛋白质合成的基因序列;
在已知蛋白质氨基酸的构成和顺序的基础上,利用氨基酸密码子表,反推出mRNA,完成对mRNA的复原;
在mRNA的复原过程中,对氨基酸密码子表做以下处理:
令X={U,C,A,G},X是U,C,A,G四个碱基中的任意一个;同理,令Y={U,C},Z={A,G},Y是U,C两个碱基中的任意一个,Z是A,G两个碱基中的任意一个;精简mRNA的编码形式;
利用mRNA寻找DNA序列中蛋白质调控基因的过程,具体步骤如下:
步骤1,取一条mRNA序列与DNA序列从头开始做比对;
步骤2,在DNA序列中所有与mRNA序列重合的部分中,选取最长的那一条,作为蛋白质调控基因中第一个外显子的序列,并且将mRNA序列中相应的部分截断去除;
步骤3,在DNA序列中,从第一个外显子之后的位置开始,继续按照步骤1、步骤2移动比对,直到找到所有外显子;
步骤4,从第一个外显子至最后一个外显子的DNA序列,即为所求的蛋白质调控基因。
2.如权利要求1所述的一种基于密码子模板的真核生物功能基因序列搜索方法,其特征在于,所述步骤1中,如果mRNA的第一个碱基与DNA的第一位碱基不匹配,则将mRNA序列沿着DNA序列后移一位,然后比对;如果mRNA序列与DNA序列从第一位碱基开始匹配,则顺次比较下一位碱基,直到碱基无法比对上为止;记录下DNA序列中该段匹配的序列;然后将mRNA后移至不匹配的那个碱基,继续以上比对过程,无论长短记录下DNA序列中与mRNA序列从首位置开始重合的部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710610516.1/1.html,转载请声明来源钻瓜专利网。