[发明专利]一种基于免疫算法的密码子优化方法有效
申请号: | 201710611752.5 | 申请日: | 2017-07-25 |
公开(公告)号: | CN110070913B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 樊隆;孙岩;吴东明;黄小罗;张丽华;柳振宇 | 申请(专利权)人: | 南京金斯瑞生物科技有限公司 |
主分类号: | G16B25/10 | 分类号: | G16B25/10;G06N3/006;G06N3/126 |
代理公司: | 北京华睿卓成知识产权代理事务所(普通合伙) 11436 | 代理人: | 程淼 |
地址: | 211100 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 免疫 算法 密码子 优化 方法 | ||
一种基于免疫算法的密码子优化方法,其特征在于先后使用免疫算法和遗传算法分别对蛋白质编码序列进行局部多目标优化和全局多目标优化,再用穷举法对序列进行微调优化,从而最大限度的搜索到最优表达序列。本发明既保留了遗传算法随机全局并行搜索的特点,又在相当大程度上避免未成熟收敛,确保快速收敛于全局最优解。本发明第一次结合利用免疫算法与遗传算法的准确度和效率的优势,通过分步流程(依次分别是局部优化、全局优化、微调优化)进行密码子优化,并通过实例测试证明该算法进行密码子优化的高效性。
技术领域
本发明涉及一种蛋白工程技术,尤其是一种蛋白工程中的密码子优化方法,具体地说是一种基于免疫算法的密码子优化方法。
背景技术
密码子简并性是指在蛋白翻译过程中,一个氨基酸可以由多个不同密码子编码的现象,编码相同氨基酸的不同密码子称为同义密码子,一个长度为200个氨基酸组成的蛋白一般可以由超过1020个不同DNA序列编码。在不同物种中,同义密码子出现的频率并不相同,这种现象称之为密码子的偏好性。密码子优化主要根据宿主表达系统的密码子偏好性等因素,在不改变蛋白氨基酸序列的前提下利用计算机算法从大量DNA编码序列中筛选出能在宿主表达系统中最高效表达蛋白的那条DNA序列。
目前密码子优化过程中常被考虑的影响蛋白表达的主要因素包括宿主细胞密码子偏好性(其常用表征参数有密码子适应度指数[CAI]、宿主细胞二联密码子偏好性[CodonContext]、CBI[Codon Bias Index]、ENC[Effective Number of Codon]、FOP[Frequencyof Optimal Codons]、CPP[Codon Preference Parameter]、tAI[tRNA adaptationindex])、 Hidden Stop Codon数量、GC含量、稀有密码子含量、mRNA抑制性调控模序(motif)数量、mRNA二级结构(主要包括发夹结构和折叠自由能)、关键密码子和机器学习中数学模型打分、microRNA结合位点、G4含量以及蛋白二级结构密码子偏好性(JoshuaB.PlotkinGrzegorz Kudla,Nature Reviews Genetics,2011)。目前可用于密码子优化的软件和算法包括DNAWorks、Jcat、Synthetic gene designer、GeneDesign 2.0、OPTIMIZER、Eugene、 mRNA Optimizer、COOL、D-Tailor、UpGene、GASCO、Codon Harmonization、QPSO、GeMS 和ATGME(Evelina Angov,Biotechnology Journal,2011;Nathan Gould et al.,Frontiers in Bioengineering and Biotechnology,2014)。
相较于密码子优化算法中已经被使用的启发式算法(比如粒子群和遗传算法),免疫算法具有其独特优势。免疫算法是基于生物免疫机制提出的一种改进的遗传算法,它将实际求解问题的目标函数对应为抗原,而问题的解对应为抗体。由生物免疫原理可知,生物免疫系统对入侵生命体的抗原通过细胞的分裂和分化作用,自动产生相应的抗体来抵御,这一过程被称为免疫应答。在免疫应答过程中,部分抗体作为记忆细胞保存下来,当同类抗原再次侵入时,记忆细胞被激活并迅速产生大量抗体,使再次应答比初次应答更快更强烈,体现了免疫系统的记忆功能.抗体与抗原结合后,会通过一系列的反应而破坏抗原.同时,抗体与抗体之间也相互促进和抑制,以维持抗体的多样性及免疫平衡,这种平衡是根据浓度机制进行的,即抗体的浓度越高,则越受抑制;浓度越低,则越受促进,体现了免疫系统的自我调节功能。
发明内容
本发明的目的是针对现有的密码子优化方法存在周期过长,表达准确性较差的问题,发明一种能在有限的时间内有效的完成对密码子优化空间的大规模搜索,即从蛋白编码序列集中筛选出最高效表达的DNA序列的基于免疫算法的密码子优化方法。
本发明的技术方案是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京金斯瑞生物科技有限公司,未经南京金斯瑞生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710611752.5/2.html,转载请声明来源钻瓜专利网。