[发明专利]一种基于模块化识别的基因网络推理方法有效
申请号: | 202110309281.9 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113066522B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 张蔚;李心语;张建明;李光 | 申请(专利权)人: | 浙江大学 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B40/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模块化 识别 基因 网络 推理 方法 | ||
本发明公开了一种基于模块化识别的基因网络推理方法。该方法将n个基因的表达信息作为训练集,其中每个基因有m个样本;采用ICA‑FDR算法对基因进行模块识别并将n个基因划分至不同基因模块中;基因模块内部的调控关系采用以梯度提升树为基础的算法进行推理,基因模块间的调控关系采用以稀疏回归为基础的算法进行推理,得出每个基因对的相关性得分;针对每个基因模块内与模块间推理得到的相关性得分分别进行归一化处理后合并,并按照得分降序排序得到最终基因调控网络。本发明为基因模块识别与基因网络推理提供了一个无缝衔接的融合框架,提高了基因模块识别的准确性,增加了基因调控网络功能的可解释性。
技术领域
本发明属于生物信息学中的基因调控网络推理领域,尤其涉及一种基于模块化识别的基因网络推理方法。
背景技术
如何在转录水平上准确阐明调控因子与目标基因之间的调控关系,是近年来计算生物学和生物信息学的核心挑战之一。更准确地识别转录调控因子与目标基因之间的调控关系对于探究细胞生长和分裂、细胞分化和发育等活动规律至关重要。此外,基因调控网络对于现代医学研究提供了有力帮助,能够从生命活动最底层—基因控制的角度模拟和预测致病基因,这将有助于医护人员对病人精准地实施靶向治疗,并有助于相应药物的研发。然而,基因调控网络推理方法大部分针对整个基因网络进行推理,但是这些方法仅推断了基因网络的拓扑结构却缺乏了明确的生物学解释,从而限制了基因网络在致病基因预测和基因治疗等领域的应用。研究表明基因调控网络结构具有模块性。在一定程度上,基因调控网络的模块化分析可以辅助我们理解整体网络的动力学性质,探索某些未知的基因功能模块,并指导基因网络的重构。然而,目前大多数经典基因模块识别的算法应用的先决条件是需要知道基因网络的拓扑结构,无法由数据驱动角度切入研究基因模块。
发明内容
基于背景技术存在的问题,本发明提出了一种基于模块化识别的高效基因网络推理方法。对基因组学和转录组学数据的深入挖掘,结合基因网络固有的模块特点,从数据驱动推理出具有社区结构的基因调控网络,为基因模块识别与基因网络推理提供了一个无缝衔接的融合框架。
为了解决上述问题,本发明采用如下技术方案:一种基于模块化识别的基因网络推理方法,该方法包括以下步骤:
S1:针对基因调控网络的推理问题,该方法从数据驱动角度切入进行基因调控网络的推理过程。假设研究对象为包含n个基因的基因调控网络,每个基因有m个表达数据样本。该方法将大小为m×n的基因表达矩阵X作为训练数据集。
S2:采用ICA-FDR算法对基因的表达矩阵进行分析,识别表达功能相近的基因。采用FastICA算法将表达矩阵X分解为混合矩阵A和源矩阵S。源矩阵S蕴含了基因数据之间的功能相似性信息,对源矩阵S进行FDR计算分析,将n个基因划分至不同的基因模块中,完成基因模块识别。
S3:针对每个基因模块内基因之间的较为紧密的调控关系,该方法采用以梯度提升树为基础的算法进行子网络推理。梯度提升树算法计算每一个基因模块中调控因子与目标基因之间的相关性得分,并根据相关性得分进行降序排列,存在调控关系的可能性较大的调控边将集中在得分列表前端。
S4:针对两个基因分别属于不同基因模块之间的基因对,该方法采用以稀疏线性回归为基础的算法进行模块间网络推理。采用稀疏线性回归算法计算调控因子与目标基因之间的相关性得分,并根据相关性得分进行降序排列,存在调控关系的可能性较大的调控边将集中在得分列表前端。
S5:对模块内基因子网络的调控边得分与模块间网络的调控边得分进行归一化处理后合并,并按降序重新排列合并后的得分列表,得到总相关性得分列表。
S6:根据基因调控网络的复杂度及研究需求,选取经验阈值,将相关性得分大于等于此阈值的调控边保留,小于此阈值的调控边舍弃,完成基因调控网络推理过程。
进一步地,所述步骤S1中的基因表达矩阵的数据种类具体包括但不限于:
S11:时序微阵列表达数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110309281.9/2.html,转载请声明来源钻瓜专利网。