[发明专利]基于多尺度模块核的致病基因识别方法及系统在审
申请号: | 202111575178.5 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114242160A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 李敏;项炬 | 申请(专利权)人: | 中南大学 |
主分类号: | G16B5/20 | 分类号: | G16B5/20 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 张勇 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 模块 致病 基因 识别 方法 系统 | ||
1.一种基于多尺度模块核的致病基因识别方法,其特征在于,包括:
通过指数抽样的多尺度模块度优化算法从综合的蛋白质相互作用组提取网络多尺度模块,构建包含网络局部信息和全局信息的初始多尺度模块谱,并采用特征信息量方法对其进行权重化处理,得到标准化多尺度模块谱;
根据所述标准化多尺度模块谱构建多尺度模块核矩阵并进行核稀疏,得到稀疏矩阵;
根据所述蛋白质相互作用组、疾病-疾病关联和疾病-基因关联,以及,根据所述稀疏矩阵、所述疾病-疾病关联和所述疾病-基因关联,分别构建两个概率矩阵,并通过游走动力学过程从两个所述概率矩阵中提取两个预测列表;
通过基于节点排位聚合的概率模型融合两个所述预测列表,得到基因概率列表,并根据所述基因概率列表预测疾病的致病基因。
2.根据权利要求1所述的方法,其特征在于,所述网络多尺度模块的公式为其中,ess表示模块s内的边比例,as表示在随机模型中模块s内的边比例,γ为分辨率参数,通过指数抽样方式获得对应不同尺度的γ分辨率参数值;
所述标准化多尺度模块谱:B=(B(1),B(2),...,B(h),...),其中,B(h)是每个尺度的模块划分矩阵,该矩阵的元素表示基因i是否属于模块s;
所述权重化处理的公式为其中,对角矩阵DIC的对角元素(DIC)ss=-log(∑iI(Bis)/N),I(x)表示计数函数,N表示节点数目。
3.根据权利要求1所述的方法,其特征在于,所述根据所述标准化多尺度模块谱构建多尺度模块核矩阵并进行核稀疏,得到稀疏矩阵的步骤,包括:
将所述标准化多尺度模块谱作为节点特征谱并通过所述节点特征谱向量内积计算得到所述多尺度模块核矩阵;
通过节点度相关的标准化方法对所述多尺度模块核矩阵内的元素进行标准化,使其元素值约束至0和1之间,得到标准化模块核矩阵;
保留所述标准化模块核矩阵中每个节点对应的预设数量的相似邻居节点,将所述标准化的模块核矩阵进行核稀疏,得到所述稀疏矩阵。
4.根据权利要求3所述的方法,其特征在于,所述保留所述标准化模块核矩阵中每个节点对应的预设数量的相似邻居节点,将所述标准化模块核矩阵进行核稀疏,得到所述稀疏矩阵的步骤,包括:
计算所述标准化模块核矩阵中每个所述节点与其邻居节点之间的相似度分值的降序排位值,得到每个所述节点的排位向量;
将全部所述节点的排位向量组合,形成排位矩阵;
根据所述排位矩阵计算新的基因网络;
根据所述基因网络得到所述稀疏矩阵。
5.根据权利要求1所述的方法,其特征在于,所述根据所述蛋白质相互作用组、疾病-疾病关联和疾病-基因关联,以及,根据所述稀疏矩阵、所述疾病-疾病关联和所述疾病-基因关联,分别构建两个概率矩阵,并通过游走动力学过程从两个所述概率矩阵中提取两个预测列表的步骤,包括:
根据所述蛋白质相互作用组、疾病-疾病关联和疾病-基因关联建立第一概率矩阵,以及,根据所述稀疏矩阵、所述疾病-疾病关联和所述疾病-基因关联建立第二概率矩阵;
将所述第一概率矩阵归一化得到第一概率转移矩阵,以及,将所述第二概率矩阵归一化得到第二概率转移矩阵;
根据所述游走动力学过程分别生成所述第一概率转移矩阵和所述第二概率转移矩阵对应的预测分值形成两个所述预测列表。
6.根据权利要求1所述的方法,其特征在于,所述通过基于节点排位聚合的概率模型融合两个所述预测列表,得到基因概率列表,并根据所述基因概率列表预测疾病的致病基因的步骤,包括:
对两个所述预测列表进行降序排列,得到两个排位列表;
通过所述概率模型融合两个所述排位列表,得到所述基因概率列表;
将所述基因概率列表进行降序排列并根据排序结果预测疾病的致病基因。
7.一种基于多尺度模块核的致病基因识别系统,其特征在于,包括:
提取模块,用于通过指数抽样的多尺度模块度优化算法从综合的蛋白质相互作用组提取网络多尺度模块,构建包含网络局部信息和全局信息的初始多尺度模块谱,并采用特征信息量方法对其进行权重化处理,得到标准化多尺度模块谱;
构建模块,用于根据所述标准化多尺度模块谱构建多尺度模块核矩阵并进行核稀疏,得到稀疏矩阵;
关联模块,用于根据所述蛋白质相互作用组、疾病-疾病关联和疾病-基因关联,以及,根据所述稀疏矩阵、所述疾病-疾病关联和所述疾病-基因关联,分别构建两个概率矩阵,并通过游走动力学过程从两个所述概率矩阵中提取两个预测列表;
预测模块,用于通过基于节点排位聚合的概率模型融合两个所述预测列表,得到基因概率列表,并根据所述基因概率列表预测疾病的致病基因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111575178.5/1.html,转载请声明来源钻瓜专利网。