[发明专利]基于元路径的miRNA-疾病关联预测方法有效

申请号：	202110524970.1	申请日：	2021-05-14
公开（公告）号：	CN113223622B	公开（公告）日：	2023-07-28
发明（设计）人：	鱼亮;郑宇佳	申请（专利权）人：	西安电子科技大学
主分类号：	G16B40/00	分类号：	G16B40/00;G06N3/042;G06N3/084;G06F18/25;G06F18/213
代理公司：	陕西电子工业专利中心 61205	代理人：	陈宏社;王品华
地址：	710071***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于路径 mirna 疾病关联预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于元路径的miRNA-疾病关联预测方法，其特征在于，包括如下步骤：

(1)获取正样本集Ω和负样本集Ω^-：

(1a)从数据库中获取与N种疾病d＝{d₁,d₂,...,d_n,...,d_N}关联的M种miRNAr＝{r₁,r₂,...,r_m,...,r_M}的S条miRNA-疾病关联数据A＝{A₁,A₂,...,A_s,...,A_S}，每种疾病d_n至少与一种miRNA关联，且每种miRNA r_m至少与一种疾病关联，其中，N≥300，d_n表示第n种疾病，M≥400，r_m表示第m种miRNA，S≥5000，A_s表示第s条miRNA-疾病关联数据，1≤m≤M，1≤n≤N；

(1b)将从miRNA-疾病关联数据A中的S条miRNA-疾病关联数据作为正样本集Ω，同时从d与r之间且不包括A的所有miRNA-疾病关联数据中随机抽取S条不重复的关联数据A′＝{A′₁,A′₂,...,A′_s,...,A′_S}，并将A′中的S条miRNA-疾病关联数据作为负样本集Ω^-；

(2)构建miRNA-疾病-基因关联网络G：

(2a)从数据库中获取与M种miRNAr＝{r₁,r₂,...,r_m,...,r_M}相关的O条miRNA-miRNA关联数据B＝{B₁,B₂,...,B_o,...,B_O}，其中，O≥5000，B_o表示第o条miRNA-miRNA关联数据；

(2b)从数据库中获取与N种疾病d＝{d₁,d₂,…,d_n,...,d_N}关联的K种基因g＝{g₁,g₂,...,g_k,...,g_K}的H条疾病-基因关联数据Y＝{Y₁,Y₂,...,Y_h,...,Y_H}，每种基因g_k至少与一种疾病关联，且每种疾病d_n至少与一种基因关联，其中，K≥400，g_k表示第k种基因，H≥1000，Y_h表示第h条疾病-基因关联数据，1≤k≤K；

(2c)以M种miRNAr＝{r₁,r₂,…,r_m,…,r_M}、N种疾病d＝{d₁,d₂,...,d_n,...,d_N}和K种基因g＝{g₁,g₂,...,g_k,…,g_K}为节点，以正样本集Ω包含的S条正样本、miRNA-miRNA关联数据B包含的O条miRNA-miRNA关联数据和疾病-基因关联数据Y包含的H条疾病-基因关联数据为边，构建miRNA-疾病-基因关联网络G＝(note,edge)，其中，note表示节点集合，note＝{r₁,r₂,…,r_m,…,r_M,d₁,d₂,…,d_n,…,d_N,g₁,g₂,…,g_k,…,g_K}，edge表示由S条正样本、O条miRNA-miRNA关联数据以及H条疾病-基因关联数据组成的边集；

(3)获取元路径集合P：

在miRNA-疾病-基因关联网络G的网络模式T＝(nt,et)上定义I条元路径，得到元路径集合P＝{P₁,P₂,...,P_i,…,P_I}，其中，I≥3，nt表示节点类型集合，nt＝{r,d,g}，et表示边类型集合，et＝{(r,r),(r,d),(d,g)}，P_i表示第i条元路径，其形式为表示元路径P_i的第len_i个节点的节点类型，表示元路径P_i的第len_i个节点和第len_i+1个节点之间的关系类型，LEN_i表示元路径P_i的路径长度，LEN_i≥2；

(4)获取每种元路径P_i的元路径实例集合

以类型的任一节点v₁为起始节点，在miRNA-疾病-基因关联网络G中寻找与v₁相连的类型的节点v₂，再寻找与v₂相连的类型的节点v₃，依此类推，最后寻找与类型的节点相连的类型的节点得到元路径P_i的Q_i条元路径实例集合其中，表示元路径P_i的第q_i条元路径实例，

(5)构建基于元路径的图神经网络模型C：

(5a)构建基于元路径的图神经网络模型C的结构：

构建包括顺次连接的节点特征降维模块、基于一种元路径的特征学习模块、基于多种元路径的特征学习模块和节点特征输出模块的图神经网络模型C；其中，节点特征降维模块包括三个并行的全连接层；基于一种元路径的特征学习模块包括池化层和多个并行的多头注意力层；基于多种元路径的特征学习模块包括两个并行的全连接层；节点特征输出模块包括两个并行的全连接层，模型C的权值参数为θ_C；

(5b)定义基于元路径的图神经网络模型C的损失函数L：

其中，表示miRNAr_m的特征向量，表示疾病d_n的特征向量，∑表示求和符号，σ表示激活函数，T表示转置；

(6)对基于元路径的图神经网络C进行迭代训练：

(6a)对每种miRNAr_m、每种疾病d_n和每种基因g_k分别进行one-hot编码，得到miRNAr_m的基特征d_n的基特征和g_k的基特征

(6b)初始化迭代次数为j，最大迭代次数为J，J≥100，第j次迭代模型C的权值参数为并令j＝0，

(6c)将每种miRNAr_m的基特征作为模型C的节点特征降维模块中第一全连接层的输入进行线性变换，将每种疾病d_n的基特征作为模型C的节点特征降维模块中第二全连接层的输入进行线性变换，将每种基因g_k的基特征作为模型C的节点特征降维模块中第三全连接层的输入进行线性变换，得到miRNAr_m的隐藏特征向量d_n的隐藏特征向量和g_k的隐藏特征向量

(6d)将miRNAr_m的隐藏特征向量d_n的隐藏特征向量和g_k的隐藏特征向量以及每种元路径P_i的元路径实例集合作为模型C的基于一种元路径的特征学习模块的输入，池化层对每条元路径实例上所有节点的隐藏特征向量进行最大池化，得到每种元路径P_i的向量集合将中起始节点相同的元路径实例在向量集合中对应的向量作为一个多头注意力层的输入进行加权求和，得到每种miRNAr_m的特征向量集合和每种疾病d_n的特征向量集合

(6e)基于多种元路径的特征学习模块中的第一全连接层对中的向量进行加权求和，得到miRNAr_m的特征向量节点特征输出模块中第一全连接层对进行线性变换，得到miRNAr_m的输出特征向量同时基于多种元路径的特征学习模块中的第二全连接层对中的向量进行加权求和，得到d_n的特征向量节点特征输出模块中第二全连接层对进行线性变换，得到d_n的输出特征向量

(6f)采用损失函数L，并通过和计算模型C的损失值L_j，然后采用反向传播方法，并通过L_j计算C的参数梯度，最后采用梯度下降算法通过C的参数梯度对C的权值参数进行更新；

(6g)判断j≥J是否成立，若是，得到训练好的miRNA-疾病关联预测模型C′，否则，令j＝j+1，并执行步骤(6c)；

(7)获取miRNA和疾病的预测结果：

采用激活函数σ，并通过训练好的miRNA-疾病关联预测模型C′输出的miRNAr_m的特征向量和d_n的特征向量计算miRNAr_m与疾病d_n的关联概率

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110524970.1/1.html，转载请声明来源钻瓜专利网。

上一篇：基于多维度单核苷酸变异特征的癌症检测方法
下一篇：岩土工程的变形数据预测方法、装置及设备

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于元路径的miRNA-疾病关联预测方法有效

专利文献下载