[发明专利]一种预测LncRNA和环境因素关联关系的方法有效
申请号: | 201810209311.7 | 申请日: | 2018-03-14 |
公开(公告)号: | CN108427865B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 周杰;徐展良 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B50/30;G16B20/00 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 预测 lncrna 环境 因素 关联 关系 方法 | ||
1.一种预测LncRNA和环境因素关联关系的方法,其特征在于,所述方法包括以下步骤:
S1、根据已知的LncRNA-环境因素关联关系网络的邻接矩阵,分别计算出LncRNA的高斯相互作用属性核相似矩阵KL和环境因素的高斯相互作用属性核相似矩阵KE;
为了提高LncRNA相关的预测精度,将得到的LncRNA相似信息进行logistic函数转换,经过转换得到的LncRNA相似信息记为SL:
其中,c=-15,d=log(9999);KL(li,lj)为一对LncRNA,即LncRNAli和LncRNAlj之间的高斯相互作用属性核相似性;
根据环境因素的化学性质构造环境因素之间的化学结构相似性矩阵E,E的第i行、第j列元素E(i,j)表示环境因素i和j之间的化学结构相似性分数,通过环境因素之间的化学结构相似性矩阵E和高斯相互作用属性核相似矩阵KE,构建环境因素相似矩阵SE;
使用拉普拉斯算子将SL和SE进行归一化,公式如下:
其中,DL和DE是对角矩阵;
S2、把LncRNA的高斯相互作用属性核相似矩阵KL和环境因素的高斯相互作用属性核相似矩阵KE通过拉普拉斯算子进行归一化;
S3、在LncRNA空间和环境因素空间中分别定义成本函数,通过最小化该成本函数,分别得到LncRNA空间和环境因素空间的最优分类器;
S4、将步骤S3得到的两种最优分类器转化为统一空间的分类器,用于计算LncRNA-环境因素关联关系的概率,根据概率对LncRNA-环境因素关联关系进行排名,概率值越高说明该LncRNA-环境因素的关联关系越强。
2.根据权利要求1所述的一种预测LncRNA和环境因素关联关系的方法,其特征在于,步骤S1的具体过程为:基于功能相似的LncRNA与相似的环境因素之间具有关联关系的假设,利用已知的LncRNA-环境因素关联关系网络,构建LncRNA的高斯相互作用属性核相似矩阵KL,首先,每一个LncRNA的IP表示在已知的LncRNA-环境因素关联关系网络中的一个二进制向量编码,‘1’代表存在关联关系,‘0’代表不存在关联关系,对于一个给定的LncRNAli,它的IP(li)被定义为LncRNA-环境因素关联关系的邻接矩阵A的第i列,如果已知LncRNAli和环境因素ej之间存在关联,则A(li,ej)为1,否则为0;然后,计算每个LncRNA对,即LncRNAli和LncRNAlj之间的高斯相互作用属性核相似性:
其中,γl用于控制高斯相互作用属性核相似性的频宽,它表示基于新的频宽参数γ′l的正规化的高斯相互作用属性核相似性频宽,γ′l取值为1;nl表示LncRNA的数量;KL表示LncRNA的高斯相互作用属性核相似矩阵,元素KL(li,lj)表示LncRNAli和LncRNAlj的高斯相互作用属性核相似性;对于一个给定的LncRNAlj,IP(lj)为LncRNA-环境因素关联关系的邻接矩阵A的第j列;
同样地,基于功能相似的LncRNA与相似的环境因素之间具有关联关系的假设,利用已知的LncRNA-环境因素关联关系网络,构建环境因素的高斯相互作用属性核相似矩阵KE:
KE(ei,ej)=exp(-γe‖IP(ei)-IP(ej)‖2)
其中,γe表示基于新频宽参数γ′e的正规化的高斯相互作用核相似性频宽;ne表示环境因素的数量;KE表示环境因素的高斯相互作用属性核相似矩阵,元素KE(ei,ej)表示环境因素ei和环境因素ej的高斯相互作用属性核相似性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810209311.7/1.html,转载请声明来源钻瓜专利网。