[发明专利]一种基于回归的性能优异的疾病和miRNA关联预测方法在审
申请号: | 202111387787.8 | 申请日: | 2021-11-22 |
公开(公告)号: | CN114171124A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 王树林;陈嘉 | 申请(专利权)人: | 湖南大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 回归 性能 优异 疾病 mirna 关联 预测 方法 | ||
1.一种基于回归的性能优异的疾病和miRNA关联预测方法,其特征在于,实施步骤为:
(1)收集和预处理数据集;
(2)计算疾病语义相似性矩阵SS、miRNA功能相似性矩阵FS、疾病/miRNA高斯相互作用轮廓核相似性矩阵KD和KM以及疾病/miRNA综合相似性矩阵SD和SM。
(3)基于回归模型将一种疾病/miRNA映射成一个特征向量。
(4)利用k均值聚类挑选负样本,利用已知疾病-miRNA关联作为正样本。
(5)构建BP神经网络并训练。
(6)利用训练好的BP神经网络做预测。
(7)验证预测结果的准确性。
2.根据权利要求1所述的一种基于回归的性能优异的疾病和miRNA关联预测方法,其特征在于,对数据集进行收集和预处理,具体包括:
收集并处理HMDD v2.0数据集,处理过后的数据包含495种miRNA和383种疾病,5430对疾病-miRNA是已证实存在关联,其余的184155对疾病-miRNA是未知的。
3.根据权利要求1所述的一种基于回归的性能优异的疾病和miRNA关联预测方法,其特征在于,计算所需的各种备用矩阵,具体包括:
计算疾病语义相似性矩阵SS、miRNA功能相似性矩阵FS、疾病/miRNA高斯相互作用轮廓核相似性矩阵KD和KM以及疾病/miRNA综合相似性矩阵SD和SM。
4.根据权利要求1所述的一种基于回归的性能优异的疾病和miRNA关联预测方法,其特征在于,基于回归将一种疾病/miRNA映射成一个特征向量,具体包括:
根据矩阵SD和SM,以及随机生成一个矩阵D和M,构建一个回归模型,利用D(i)和D(j)的改进余弦值学习SD(i,j)元素,利用M(i)和M(j)的余弦值学习SM(i,j),最后得到的矩阵D和M就是疾病嵌入层和miRNA嵌入层对应的矩阵。
5.根据权利要求1所述的一种基于回归的性能优异的疾病和miRNA关联预测方法,其特征在于,利用k均值聚类挑选负样本,利用已知疾病-miRNA作为正样本,具体包括:
根据矩阵SD和SM,[SD(i),SM(j)]表示该未知疾病di和miRNA mj对应的组合向量,利用k-means将所有未知疾病-miRNA关联对对应的组合向量进行聚类,再根据划分结果将所有的未知疾病-miRNA对分成簇,再根据每簇的大小与总样本的大小的比例来挑选负样本。
6.根据权利要求1所述的一种基于回归的性能优异的疾病和miRNA关联预测方法,其特征在于,构建BP神经网络并训练,具体包括:
构建BP神经网络,并用正负样本对应的组合特征向量训练神经网络。
7.根据权利要求1所述的一种基于回归的性能优异的疾病和miRNA关联预测方法,其特征在于,利用训练好BP神经网络做预测,具体包括:
将184155对疾病-miRNA对应的特征向量输入神经网络中,得到关联预测得分。
8.根据权利要求1所述的一种基于回归的性能优异的疾病和miRNA关联预测方法,其特征在于,利用dbDEMC数据库验证预测结果的准确性,具体包括:
选定某种疾病,将本模型预测的与该疾病存在潜在关联的各种miRNA的关联得分从大到小排序,然后验证在dbDEMC数据库中是否存在关联,从而验证预测结果的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111387787.8/1.html,转载请声明来源钻瓜专利网。