[发明专利]从差异网络中识别驱动基因的方法有效
| 申请号: | 202010461333.X | 申请日: | 2020-05-27 |
| 公开(公告)号: | CN111816246B | 公开(公告)日: | 2023-01-10 |
| 发明(设计)人: | 谢江;杨伏长;王娇 | 申请(专利权)人: | 上海大学 |
| 主分类号: | G16B5/20 | 分类号: | G16B5/20;G16B20/00 |
| 代理公司: | 贵州派腾知识产权代理有限公司 52114 | 代理人: | 唐斌 |
| 地址: | 200444*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 差异 网络 识别 驱动 基因 方法 | ||
1.一种识别差异网络中驱动基因的方法,其特征在于:给定两个代表两种生物状态的基因调控网络,首先量化网络中边的不确定性,然后计算网络中任意两个节点之间最强且最稳定的调控关系,再后将节点特征化表示为网络流的分布,最后量化每个基因在两个网络中的网络流分布差异以识别驱动基因。
2.一种识别差异网络中驱动基因的方法,其特征在于将网络流模型与信息熵概念相结合,具体步骤如下:
A.量化每个网络中边的不确定性:将基因和基因之间的相互作用强度转化为信息量的期望来量化边的不确定性;
B.计算最优流:使用最小费用最大流模型计算网络中任意两个节点之间的最优流;
C.节点分布化:将一个基因在特定状态下对剩余基因的最优流进行标准化,并将这些最优流表示为分布的形式以描述该基因的特征;
D.量化分布差异:量化每个基因在两个网络中的网络流分布差异,差异最大的基因是驱动基因的可能性越大。
3.根据权利要求2所述识别差异网络中驱动基因的方法,其特征在于:所述步骤A的基于基因调控网络的边的概率性连接,将基因和基因之间的相互作用强度转化为信息量的期望来量化连接的不确定性,具体步骤如下:
A1、将两个有权的基因调控网络和作为输入,并假设两个网络之间共同的基因个数为k,基因调控网络中边的权重表示该边所连接的两基因之间的调控相关性,将调控相关性转化为信息量的期望来量化这种不确定性,而信息量的期望则是用于评估信号系统稳定性的香农熵公式的一个子项,计算基因i到基因j的信息含量zi,j,为了方便符号表示,后续的网络标签1和2被省略,表明这个转化公式分别作用于网络1和网络2,省略网络标签后每个网络中转化公式如下:
4.根据权利要求3所述识别差异网络中驱动基因的方法,其特征在于所述步骤B的使用最小费用最大流模型计算网络中任意两个节点之间的最优流,具体步骤如下:
B1、使用最小费用最大流模型计算网络中任意两个节点之间的网络流,这种网络流模型的实施基于网络中任意两节点之间的最短路径,在该模型中,每个边给定了一个容量ci,j表示这条边的带宽,zi,j表示这条边的费用和fi,j表示流经这条边的动态流量,以任意两个点为例,源点s和汇点t,s≠t,从s到t的最优化网络流Fs,t计算如下:
fi,j≤ci,j,
∑wfs,w=∑wfw,t,w是任意节点。
5.根据权利要求4所述识别差异网络中驱动基因的方法,其特征在于所述步骤C的将一个基因在特定状态下对剩余基因的最优流进行标准化,并将这些最优流表示为分布的形式以描述该基因的特征,具体步骤如下:
C1、标准化:假设每个基因的信号传播能力相对稳定,而传播到不同基因的信号强度在不同的条件下是可变的,可以将该基因的信号传播能力表示为分布的形式,具体操作为:将该基因对剩余基因的最优流进行求和作为标准化的分母,随后将该基因对剩余基因的每一条最优流除以分母以完成标准化步骤,标准化公式如下:
C2、分布表示:对于网络中的任意节点i到网络中剩余的所有公共节点的网络流归纳为一个概率分布表示如下:
6.根据权利要求5所述识别差异网络中驱动基因的方法,其特征在于所述步骤D的基于对等的相对熵来量化每个基因在两个网络中的网络流分布差异以识别驱动基因,具体步骤如下:采用对等的相对熵来计算同一个节点在不同网络中的网络流分布差异,该节点在不同网络下的差异分数Di计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010461333.X/1.html,转载请声明来源钻瓜专利网。





