[发明专利]一种q-HMM和规则相结合的蛋白质二级结构预测方法在审
申请号: | 202110978944.6 | 申请日: | 2021-08-25 |
公开(公告)号: | CN115732029A | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 唐千清;张琬沁;张雨柔;姚洪亮;姚洪达 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 汪清 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 hmm 规则 相结合 蛋白质 二级 结构 预测 方法 | ||
本发明公开了一种q‑HMM和规则相结合的蛋白质二级结构预测方法,首先建立q‑HMM并利用关联规则优化模型,然后训练q‑HMM参数,使用模型参数进行预测,最后得出预测的蛋白质二级结构链。本发明将经典HMM改进为q‑HMM,建立了适用于蛋白质二级结构预测的双向q‑HMM,同时考虑了邻近的氨基酸一级结构和二级结构的影响,弥补了经典HMM固有的时序特性的缺陷;使用q‑HMM的同时融入了规则以提高模型预测的准确度,双向预测提高了计算速度,同时也弥补了规则预测的不足。
技术领域
本发明属于蛋白质二级结构预测领域,特别是一种q-HMM和规则相结合的蛋白质二级结构预测方法。
背景技术
自人类基因组计划在上世纪末正式启动后,科学家们前仆后继地攻克难关,终于在本世纪初完成了人类基因图谱的绘制,人类自此进入后基因组时代,而蛋白质组研究是后基因组时代生命科学中最重大的研究课题之一。想要研究蛋白质组,首要的任务是研究其功能与结构。在科学界普遍的认知是,蛋白质二级结构预测是蛋白质整体结构预测的先驱。蛋白质二级结构是指,多肽主链骨架原子沿一定的轴盘旋或折叠而形成的特定的构象,即肽链主链骨架原子的空间位置排布,不涉及氨基酸残基侧链。
蛋白质二级结构的主要形式包括α-螺旋、β-折叠、β-转角和无规则卷曲。由于蛋白质的分子量较大,所以一个蛋白质分子的不同肽段可能含有不同形式的二级结构。一种蛋白质的二级结构并非单纯的α-螺旋或β-折叠等结构,而是这些不同类型构象的组合,且不同肽段的占比通常不同。因此,如果能够寻找一个准确率高的蛋白质二级结构预测方法,就会对后续蛋白质功能与结构的研究有着承上启下的重要作用。
现有的蛋白质二级结构预测方法主要有:隐马尔可夫模型、立体化学法、神经网络法、氢键数法等,可大致分为两代。
第一代预测方法:假设多肽链序列中的氨基酸在形成二级结构时,是独立折叠、不受氨基酸之间相互作用的影响,故该时期的预测方法多是以统计的方法为主。这类预测方法主要是根据单个残基的性质来做判断,在预测时将氨基酸分成螺旋、折叠、转角的形成子或切断子,再根据此信息找出氨基酸序列中可能形成各二级结构的片段。但这样的假设并不正确,越来越多的研究和试验证明了序列中存在有局部影响作用。第一代预测方法以Chou-Fasman为主要代表,准确率大概在50%-60%之间。
第二代预测方法:在众多的研究和试验已经证明局部作用也会影响二级结构的形成,这一时期的预测方法一般都利用滑动窗口技术加入局部影响作用。普遍思路如下:将已知结构的蛋白质氨基酸序列以一个大小固定的窗口,利用滑动窗口的方式将其切成数个片段,再设法从这些片段中提取出有用的信息。这一类预测方法虽然加入了对局部影响作用的考虑,但是没有考虑到各个窗口片段之间的影响,也没有考虑远程氨基酸之间的相互影响。因此其预测的准确率也只大约维持在60%-65%之间。这一代预测方法包括GOR3、Levin等。
发明内容
本发明的目的在于提供一种q-HMM和规则相结合的蛋白质二级结构预测方法,以提高预测蛋白质二级结构的准确度。
实现本发明目的的技术解决方案为:
一种q-HMM和规则相结合的蛋白质二级结构预测方法,包括以下步骤:
步骤1、建立q-HMM(量子-隐马尔可夫模型):定义蛋白质二级结构状态序列集合S、蛋白质一级结构观测序列集合V、q-HMM中的状态转移张量A、q-HMM中的发射张量B、q-HMM中的初始张量π;
步骤2、提取关联规则:定义关联规则参数,计算提取蛋白质二级结构规则的置信度与支持度,对比置信度与支持度的阈值产生频繁项集,最终得到强关联规则;
步骤3、使用统计方法求解q-HMM参数:训练q-HMM模型参数:使用Baum Welch算法对q-HMM模型参数进行迭代计算,并利用重估公式得到q-HMM中的状态转移张量A、q-HMM中的发射张量B、q-HMM中的初始张量π;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110978944.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:压钢筋陶粒混凝土墙板气动补板机
- 下一篇:电动工具、单手锯