[发明专利]一种基于集成学习的生物医学网络关联预测方法有效
申请号: | 202110236007.3 | 申请日: | 2021-03-03 |
公开(公告)号: | CN112951320B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 欧阳乐;卢帆 | 申请(专利权)人: | 深圳大学 |
主分类号: | G16B15/30 | 分类号: | G16B15/30;G16B20/20;G16B40/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 518061 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 生物医学 网络 关联 预测 方法 | ||
本发明针对现有技术的局限性,提出了一种基于集成学习的生物医学网络关联预测方法,其引入了多个算法的预测结果的信息,据此提取出了两类生物医学实体内部的强联系,并构建了相应的低维特征;通过矩阵分解模型进一步学习两类低维特征之间的联系以解释观测到的生物医学关联,最终模型重构两部分低维特征,得到集成的预测结果;能够突破单一方法的局限,综合各个算法的视角,提供更加准确,更具备鲁棒性的预测结果。
技术领域
本发明涉及计算生物学技术领域,具体涉及生物数据挖掘,更具体的涉及一种基于集成学习的生物医学网络关联预测方法。
背景技术
复杂疾病例如癌症的产生往往不是由单个生物分子的失调和突变导致,而是由生物分子间的相互作用构成的调控网络的功能异常导致。疾病发生发展过程中,会有一些生物分子出现异常行为,识别与疾病发生有高相关性的异常生物分子将对疾病的预防、诊断、治疗非常有帮助。近年来,已经有很多研究通过生物实验验证了不同类型生物实体之间的联系,例如药物与蛋白质靶标的关联,疾病与micro RNA的关联,疾病与长链非编码RNA(Long non-coding RNA,lncRNA)的关联等。然而,通过生物实验方法来识别新的生物医学关联需要耗费大量时间,并且代价高昂。而在计算机领域中,这类问题可以抽象为一个二分网络的关联预测问题。生物医学二分网络的概念图可见图1。因此,借助计算方法预测潜在的关联网络,从而为生物实验提供参考和建议,这将有助于提升生物医学关联识别这项任务的效率并降低成本。
近十年,涌现出了各种应用于生物医学网络关联预测任务的计算方法。根据原理,可以大致分为三类方法:网络扩散模型、基于特征的分类方法和基于矩阵分解的方法。网络扩散模型主要是运用基于图的方法对生物医学网络中的关联进行扩散传播,从而对网络中的潜在的关联进行预测。基于特征的分类方法,是用关联双方节点的特征表示每个关联,然后输入到机器学习模型中进行训练。基于矩阵分解的方法,是尝试通过生物医学关联矩阵学习出两个或多个低维因子矩阵,然后将他们相乘来重构出一个关联矩阵。然而,面对类型各异的生物医学关联网络,仅仅依赖于单一预测方法的假设可能无法准确地刻画所有数据。
公开日为2020.04.10,公开号为:CN110993113A的中国发明专利:基于MF-SDAE的lncRNA-疾病关系预测方法及系统,试图通过利用多个lncRNA数据库及多个疾病数据库,提取lncRNA的多种特征以及疾病的多种特征,以提供一种快速有效的方案,但该方案仍有一定的局限性。
发明内容
针对现有技术的局限,本发明提出一种基于集成学习的生物医学网络关联预测方法,本发明采用的技术方案是:
一种基于集成学习的生物医学网络关联预测方法,包括以下步骤:
S1,获取待预测的两类生物实体的原始相似度矩阵以及关联矩阵;分别运用若干个生物医学网络关联预测算法,根据所述原始相似度矩阵以及关联矩阵对所述生物实体进行关联预测,获得各算法的预测结果;
S2,根据各算法的预测结果,分别计算获得所述生物实体的预测相似度矩阵;对所述预测相似度矩阵进行稀疏化处理后,结合各算法的预测结果,以加权叠加的方式计算获得所述生物实体的集成相似度矩阵;
S3,运用奇异值分解对所述原始相似度矩阵提取低维特征,结合所述集成相似度矩阵构建自适应加权集成矩阵分解模型;
S4,对所述自适应加权集成矩阵分解模型进行训练优化直至模型收敛;
S5,运用收敛后的所述自适应加权集成矩阵分解模型重建预测矩阵作为所述生物实体关联预测的最终结果。
相较于现有技术,本发明引入了多个算法的预测结果的信息,据此提取出了两类生物医学实体内部的强联系,并构建了相应的低维特征;通过矩阵分解模型进一步学习两类低维特征之间的联系以解释观测到的生物医学关联,最终模型重构两部分低维特征,得到集成的预测结果;能够突破单一方法的局限,综合各个算法的视角,提供更加准确,更具备鲁棒性的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110236007.3/2.html,转载请声明来源钻瓜专利网。