[发明专利]基于多尺度模块核的致病基因识别方法及系统在审
申请号: | 202111575178.5 | 申请日: | 2021-12-21 |
公开(公告)号: | CN114242160A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 李敏;项炬 | 申请(专利权)人: | 中南大学 |
主分类号: | G16B5/20 | 分类号: | G16B5/20 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 张勇 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 模块 致病 基因 识别 方法 系统 | ||
本公开实施例中提供了一种基于多尺度模块核的致病基因识别方法及系统,属于生物信息学技术领域,具体包括:通过指数抽样的多尺度模块度优化算法从综合的蛋白质相互作用组提取网络多尺度模块,得到标准化多尺度模块谱;根据标准化多尺度模块谱构建多尺度模块核矩阵并进行核稀疏;提取两个预测列表;融合两个预测列表得到基因概率列表,并根据基因概率列表预测疾病的致病基因。通过本公开的方案,提取多尺度模块谱并标准化,有效融合不同层次、特异性的网络模块结构信息后进行稀疏化,提供了新的基因‑基因关联,然后来自原始异构网络和结合多尺度模块核的异构网络的预测列表的排位聚合有效融合了互补的预测信息,提高了预测效率和预测精准度。
技术领域
本公开实施例涉及生物信息学技术领域,尤其涉及一种基于多尺度模块核的致病基因识别方法及系统。
背景技术
目前,疾病相关基因的鉴定对于人类复杂疾病的研究非常重要,这是理解疾病分子机制的基础。传统方法存在候选空间大且候选基因的实验鉴定既昂贵又耗时等问题。因此,疾病致病基因预测方法的开发成为计算生物学的一个重要课题,它对复杂疾病的研究有着重要的促进作用。
已经提出了许多计算方法来预测疾病相关基因,而基于网络的方法是疾病基因预测中最流行的策略之一。通过候选基因和种子基因(即已知与特定疾病相关的基因)之间的直接相互作用、网络距离或接近度来预测疾病相关基因是一种自然而有效的策略。带重启的随机行走等网络传播方法可以更有效地探索生物网络中种子周围的邻域拓扑,因此已被广泛应用于疾病基因预测以及相关问题,并且还被扩展到更复杂的网络模型,如同质或异构网络中的多图模型、多网络模型和多重网络模型。这些模型可以集成多种类型的生物网络。然而,由于生物网络中的数据噪声等问题,这些方法仍有进一步的改进空间。
生物分子网络中模块结构分析可以为人类复杂疾病的研究提供有用的见解。多尺度模块结构(MMS)广泛存在于生物分子网络中。这些生物分子网络由子网络组成,而子网络可以在深层的层次结构中逐渐分解为更小的子网络。例如,一些复合物可能由多个次级复合物组成,基因功能注释的层次结构也意味着存在多个尺度上的功能模块。MMS可以为疾病研究提供从局部到全局的更丰富的信息,但是如何挖掘隐藏在MMS中的有价值的信息仍然是疾病基因预测的一个具有挑战性的课题。
可见,亟需一种高效精准的基于多尺度模块核的致病基因识别方法。
发明内容
有鉴于此,本公开实施例提供一种基于多尺度模块核的致病基因识别方法及系统,至少部分解决现有技术中存在致病基因识别效率和识别精准度较差的问题。
第一方面,本公开实施例提供了一种基于多尺度模块核的致病基因识别方法,包括:
通过指数抽样的多尺度模块度优化算法从综合的蛋白质相互作用组提取网络多尺度模块,构建包含网络局部信息和全局信息的初始多尺度模块谱,并采用特征信息量方法对其进行权重化处理,得到标准化多尺度模块谱;
根据所述标准化多尺度模块谱构建多尺度模块核矩阵并进行核稀疏,得到稀疏矩阵;
根据所述蛋白质相互作用组、疾病-疾病关联和疾病-基因关联,以及,根据所述稀疏矩阵、所述疾病-疾病关联和所述疾病-基因关联,分别构建两个概率矩阵,并通过游走动力学过程从两个所述概率矩阵中提取两个预测列表;
通过基于节点排位聚合的概率模型融合两个所述预测列表,得到基因概率列表,并根据所述基因概率列表预测疾病的致病基因。
根据本公开实施例的一种具体实现方式,所述网络多尺度模块的公式为其中,ess表示模块s内的边比例,as表示在随机模型中模块s内的边比例,γ为分辨率参数,通过指数抽样方式获得对应不同尺度的γ分辨率参数值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111575178.5/2.html,转载请声明来源钻瓜专利网。