[发明专利]一种q-HMM和规则相结合的蛋白质二级结构预测方法在审
申请号: | 202110978944.6 | 申请日: | 2021-08-25 |
公开(公告)号: | CN115732029A | 公开(公告)日: | 2023-03-03 |
发明(设计)人: | 唐千清;张琬沁;张雨柔;姚洪亮;姚洪达 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 汪清 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 hmm 规则 相结合 蛋白质 二级 结构 预测 方法 | ||
1.一种q-HMM和规则相结合的蛋白质二级结构预测方法,其特征在于,包括以下步骤:
步骤1、建立q-HMM(量子-隐马尔可夫模型):定义蛋白质二级结构状态序列集合S、蛋白质一级结构观测序列集合V、q-HMM中的状态转移张量A、q-HMM中的发射张量B、q-HMM中的初始张量π;
步骤2、提取关联规则:定义关联规则参数,计算提取蛋白质二级结构规则的置信度与支持度,对比置信度与支持度的阈值产生频繁项集,最终得到强关联规则;
步骤3、使用统计方法求解q-HMM参数:使用Baum-Welch算法对q-HMM模型参数进行迭代计算,并利用重估公式得到q-HMM中的状态转移张量A、q-HMM中的发射张量B、q-HMM中的初始张量π;
步骤4、结合关联规则使用模型参数进行双向预测:根据步骤2得到的强关联规则,确定蛋白质二级结构预测的起始位置;利用蛋白质序列片段以及步骤3得到的q-HMM中的状态转移张量A、q-HMM中的发射张量B、q-HMM中的初始张量π,并结合Viterbi算法进行双向迭代,预测得出整条蛋白质二级结构链。
2.根据权利要求1所述q-HMM和规则相结合的蛋白质二级结构预测方法,其特征在于,步骤1中蛋白质二级结构状态序列集合S={s1,s2,…,si,…sN},其中si表示蛋白质二级结构的一种状态;
蛋白质一级结构观测序列表示为集合V={v1,v2,…,vj,…,vM},其中vj表示一种氨基酸;
q-HMM中的状态转移张量其中为状态转移张量A的每一维度的分量,表示满足在某个t位置的前n个状态值及前m个观测值已经确定的的条件下,转移到第t位置的状态值为i的概率;
q-HMM中的发射张量其中为发射张量B的每一维度的分量,表示满足在第t位置的前n个状态值及前m个观测值已经确定的的条件下,转移到第t位置的观测值为k的概率;
q-HMM中的初始张量其中为初始张量π的每一维度的分量,表示所有满足初始位置的n个状态值在已知m个观测值条件的蛋白质序列的概率。
3.根据权利要求1所述q-HMM和规则相结合的蛋白质二级结构预测方法,其特征在于,步骤2定义的关联规则参数包括:蛋白质序列文件提取的有可能成为规则的所有蛋白质序列片段的集合H,定义提取出的总片段数量|K|,定义所有前项数量为σ(X),定义所有蛋白质一级结构片段X和蛋白质二级结构片段Y同时出现片段数量为σ(X∪Y);
定义蛋白质片段的前项X与后项Y,并定义所有前项数量σ(X)以及所有蛋白质一级结构片段X和蛋白质二级结构片段Y同时出现片段数量为σ(X∪Y),计算提取蛋白质二级结构置信度与支持度
4.根据权利要求1所述q-HMM和规则相结合的蛋白质二级结构预测方法,其特征在于,步骤2最终得到强关联规则,即满足支持度大于等于支持度下界minsup,置信度大于等于置信度下界minconf的所有规则成为规则集合R:
支持度
置信度
其中minsup为支持度下界,minconf为置信度下界;σ(X∪Y)为所有蛋白质一级结构片段X和蛋白质二级结构片段Y同时出现片段数量;|K|为提取出的总片段数量;σ(X)为所有前项数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110978944.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:压钢筋陶粒混凝土墙板气动补板机
- 下一篇:电动工具、单手锯