[发明专利]一种基于变分贝叶斯的基因调控网络结构辨识方法在审
申请号: | 202210035654.2 | 申请日: | 2022-01-13 |
公开(公告)号: | CN114360641A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 刘切;王浩;李俊豪;柴毅 | 申请(专利权)人: | 重庆大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G06N7/00;G06K9/62 |
代理公司: | 重庆市嘉允启行专利代理事务所(普通合伙) 50243 | 代理人: | 胡柯 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分贝 基因 调控 网络 结构 辨识 方法 | ||
1.一种基于变分贝叶斯的基因调控网络结构辨识方法,其特征在于,具体步骤如下:
1)数据采集:从DREAM4平台的数据库中采集典型基因调控网络GRN的基因表达数据,获得采集数据;
2)构建模型:采用含有未知噪声的随机非线性状态空间模型来描述步骤1)中的采集数据中基因序列的表达过程;
3)模型参数估计:采用变分贝叶斯的方法对状态空间模型中的参数进行估计,并输出基因序列表达数据;
4)得到GRN结构:利用极端梯度提升XGBoost方法建立基因调控网络GRN的决策树模型,辨别基因间的相互作用关系,得到最终的基因调控网络GRN结构。
2.如权利要求1所述的一种基于变分贝叶斯的基因调控网络结构辨识方法,其特征在于,步骤2)中构建的随机非线性状态空间模型方法如下:
式(1)中,xt,i为第i基因在t时刻真实的基因表达值,yt,i为第i基因在t时刻的测量表达值,其中i∈[1,n],n为基因的个数,Ci为第i个基因的衰减率,Gij为第j个基因对第i个基因的调控作用,其中j∈[1,n],则Gij表示为gi=[gi1,gi2,...,gi(i-1),0,gi+1,...,gin],即第i个基因受到除自身外的其他所有基因的调控,vi为过程噪声,wi为测量噪声,f(x(t))是系统模型中的非线性方程,表示为:
则n基因中任一基因的随机非线性状态空间模型为:
3.如权利要求2所述的一种基于变分贝叶斯的基因调控网络结构辨识方法,其特征在于,步骤3)中采用变分贝叶斯的方法对状态空间模型中的参数进行估计,并输出基因序列表达数据,具体步骤如下:
3-1)定义非线性状态空间模型中参数:Ξ=[C,G,ymis,x1:n,S,R,α]T,其中:S为过程噪声v的精度,R为测量噪声w的精度,ymis={ym1,ym2,...,ymα}表示在时刻{m1,m2,...,mα}丢失的基因表达测量值,yobs={ya1,ya2,...,yaα}表示为在时刻{a1,a2,...,aα}基因表达的测量值,则对于参数的估计可以表示为在给定观测数据下评估隐变量的后验分P(Ξ|yobs);
3-2)通过变分贝叶斯的方法对随机非线性状态空间模型中的参数C、G、ymis、x1:n、S、R、α进行估计。
4.如权利要求3所述的一种基于变分贝叶斯的基因调控网络结构辨识方法,其特征在于,步骤3-1)中在给定观测数据下评估隐变量的后验分布P(Ξ|yobs)的具体步骤如下:
基因表达的测量值yobs的对数似然函数表示为:
lnp(yobs)=∫q(Ξ)lnp(yobs)dΞ (4)
式(4)中,q(Ξ)为任意概率密度函数;
将对数似然函数写成J+KL的形式:
式(5)中,KL≥0,当且仅当q(Ξ)=p(Ξ|yobs)时等号成立,J为对数似然函数lnp(yobs)的下界,这时计算隐变量的后验分布等价于计算argmaxJ。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210035654.2/1.html,转载请声明来源钻瓜专利网。