[发明专利]一种基于推荐模型的miRNA靶基因预测方法有效
| 申请号: | 201610120986.5 | 申请日: | 2016-03-03 |
| 公开(公告)号: | CN105808976B | 公开(公告)日: | 2018-02-27 |
| 发明(设计)人: | 蒋辉;王建新;李敏;颜晓东;王劭恺 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06F19/20 | 分类号: | G06F19/20 |
| 代理公司: | 长沙市融智专利事务所43114 | 代理人: | 杨萍 |
| 地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于推荐模型的miRNA靶基因预测方法(miRTRS),利用已被实验验证过的miRNA靶基因数据构建miRNA与基因的二分图,并在此基础上,使用基于二分图的推荐算法来计算一个基因是miRNA靶基因的可能性,并在此推荐算法中引入了miRNA之间的序列相似性这一生物数据。最后通过推荐值降序排序,取其排名靠前的认为是miRNA靶基因关系。本发明简单易用,与已有的miRNA靶基因预测方法相比较,本发明提出的方法在预测的准确性、敏感度和特异性等方面都有明显提高,能为生物学家进行miRNA靶基因发现的实验和进一步研究提供有价值的参考信息。 | ||
| 搜索关键词: | 一种 基于 推荐 模型 mirna 基因 预测 方法 | ||
【主权项】:
一种基于推荐模型的miRNA靶基因预测方法,其特征在于,包括以下步骤:步骤1:计算各个miRNA之间的序列相似性,生成miRNA序列相似性矩阵,并对miRNA序列相似性矩阵标准化;步骤2:构建用于表示已被生物学实验验证过的miRNA与基因的关系的二分图G1;以M={m1,m2,…,ml,…,mp}表示p个miRNA的集合,其中ml为第l个miRNA,l=1,2,…,p;以T={t1,t2,…,tj,…,tn}表示n个基因的集合,其中tj为第j个基因,j=1,2,…,n;用二分图G1=(V1,E1)表示miRNA与基因的关系,二分图G1中顶点集合V1=M∪T,边集E1={{ml,tj}|ml∈M且tj∈T,miRNA ml与基因tj有已被生物学实验验证过的靶向关系},即如果已经通过生物学实验验证基因tj是miRNA ml的靶基因,则在二分图G1中顶点tj与ml之间有一条边相连;设A={ajl}n*p为二分图的邻接矩阵,其中的元素ajl为:步骤3:基于miRNA与基因的关系以及各个miRNA之间的序列相似性,计算集合T中任意两个基因ti和tj间的相似性sij;步骤4:构建带权的无向图G2=(T,E2,W),图G2中顶点集合T是基因的集合;边集E2={{ti,tj}|ti,tj∈T且基因ti与基因tj有共同邻居},即对于集合T中的任意两个基因ti与tj,如果它们有共同邻居,也就是ti与tj被共同的miRNA调控,则在ti与tj之间有一条无向边相连,该边的权重记为wij;图G2中权重集合W={wij}n*n,其中元素wij的计算公式如下:其中,sij表示基因ti和tj间的相似性,1≤i,j≤n;d(ml),d(ti),d(tj)分别表示miRNAml、基因ti、基因tj的在二分图G1中的度,λ∈(0,1)为调整因子,ail,ajl∈A,A为二分图的邻接矩阵;步骤5:计算将基因ti推荐给miRNA ml的推荐值,排序输出结果;设Ri(ti,ml)为将基因ti推荐给miRNA ml的推荐值,则其中wij∈W,ajl∈A;对于每个基因ti进行如下三步处理:1)计算其对miRNA集合M中的每一个miRNA ml的推荐值Ri(ti,ml);2)对Ri((ti,ml)|ail=0)进行降序排序,即对去除已知的ti与miRNA有靶向关系的推荐值后剩余的推荐值进行降序排列;3)输出排名前N个Ri(ti,ml)所对应的miRNA ml,认为其与基因ti有靶向关系;即基因ti是miRNA ml的靶基因,40≤N≤60。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610120986.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于指纹锁定/解锁电脑屏幕的方法
- 下一篇:药品调配检测的方法及系统
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





