[发明专利]一种q-HMM和规则相结合的蛋白质二级结构预测方法在审

专利信息
申请号: 202110978944.6 申请日: 2021-08-25
公开(公告)号: CN115732029A 公开(公告)日: 2023-03-03
发明(设计)人: 唐千清;张琬沁;张雨柔;姚洪亮;姚洪达 申请(专利权)人: 南京理工大学
主分类号: G16B15/00 分类号: G16B15/00
代理公司: 南京理工大学专利中心 32203 代理人: 汪清
地址: 210094 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 hmm 规则 相结合 蛋白质 二级 结构 预测 方法
【说明书】:

发明公开了一种q‑HMM和规则相结合的蛋白质二级结构预测方法,首先建立q‑HMM并利用关联规则优化模型,然后训练q‑HMM参数,使用模型参数进行预测,最后得出预测的蛋白质二级结构链。本发明将经典HMM改进为q‑HMM,建立了适用于蛋白质二级结构预测的双向q‑HMM,同时考虑了邻近的氨基酸一级结构和二级结构的影响,弥补了经典HMM固有的时序特性的缺陷;使用q‑HMM的同时融入了规则以提高模型预测的准确度,双向预测提高了计算速度,同时也弥补了规则预测的不足。

技术领域

本发明属于蛋白质二级结构预测领域,特别是一种q-HMM和规则相结合的蛋白质二级结构预测方法。

背景技术

自人类基因组计划在上世纪末正式启动后,科学家们前仆后继地攻克难关,终于在本世纪初完成了人类基因图谱的绘制,人类自此进入后基因组时代,而蛋白质组研究是后基因组时代生命科学中最重大的研究课题之一。想要研究蛋白质组,首要的任务是研究其功能与结构。在科学界普遍的认知是,蛋白质二级结构预测是蛋白质整体结构预测的先驱。蛋白质二级结构是指,多肽主链骨架原子沿一定的轴盘旋或折叠而形成的特定的构象,即肽链主链骨架原子的空间位置排布,不涉及氨基酸残基侧链。

蛋白质二级结构的主要形式包括α-螺旋、β-折叠、β-转角和无规则卷曲。由于蛋白质的分子量较大,所以一个蛋白质分子的不同肽段可能含有不同形式的二级结构。一种蛋白质的二级结构并非单纯的α-螺旋或β-折叠等结构,而是这些不同类型构象的组合,且不同肽段的占比通常不同。因此,如果能够寻找一个准确率高的蛋白质二级结构预测方法,就会对后续蛋白质功能与结构的研究有着承上启下的重要作用。

现有的蛋白质二级结构预测方法主要有:隐马尔可夫模型、立体化学法、神经网络法、氢键数法等,可大致分为两代。

第一代预测方法:假设多肽链序列中的氨基酸在形成二级结构时,是独立折叠、不受氨基酸之间相互作用的影响,故该时期的预测方法多是以统计的方法为主。这类预测方法主要是根据单个残基的性质来做判断,在预测时将氨基酸分成螺旋、折叠、转角的形成子或切断子,再根据此信息找出氨基酸序列中可能形成各二级结构的片段。但这样的假设并不正确,越来越多的研究和试验证明了序列中存在有局部影响作用。第一代预测方法以Chou-Fasman为主要代表,准确率大概在50%-60%之间。

第二代预测方法:在众多的研究和试验已经证明局部作用也会影响二级结构的形成,这一时期的预测方法一般都利用滑动窗口技术加入局部影响作用。普遍思路如下:将已知结构的蛋白质氨基酸序列以一个大小固定的窗口,利用滑动窗口的方式将其切成数个片段,再设法从这些片段中提取出有用的信息。这一类预测方法虽然加入了对局部影响作用的考虑,但是没有考虑到各个窗口片段之间的影响,也没有考虑远程氨基酸之间的相互影响。因此其预测的准确率也只大约维持在60%-65%之间。这一代预测方法包括GOR3、Levin等。

发明内容

本发明的目的在于提供一种q-HMM和规则相结合的蛋白质二级结构预测方法,以提高预测蛋白质二级结构的准确度。

实现本发明目的的技术解决方案为:

一种q-HMM和规则相结合的蛋白质二级结构预测方法,包括以下步骤:

步骤1、建立q-HMM(量子-隐马尔可夫模型):定义蛋白质二级结构状态序列集合S、蛋白质一级结构观测序列集合V、q-HMM中的状态转移张量A、q-HMM中的发射张量B、q-HMM中的初始张量π;

步骤2、提取关联规则:定义关联规则参数,计算提取蛋白质二级结构规则的置信度与支持度,对比置信度与支持度的阈值产生频繁项集,最终得到强关联规则;

步骤3、使用统计方法求解q-HMM参数:训练q-HMM模型参数:使用Baum Welch算法对q-HMM模型参数进行迭代计算,并利用重估公式得到q-HMM中的状态转移张量A、q-HMM中的发射张量B、q-HMM中的初始张量π;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110978944.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top