[发明专利]基于生成对抗网络的基因表达全谱推断方法有效
申请号: | 201810444012.1 | 申请日: | 2018-05-10 |
公开(公告)号: | CN108595916B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 陈晋音;郑海斌;王桢;应时彦;李南;施朝霞 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 基因 表达 推断 方法 | ||
本发明公开了一种基于生成式对抗网络的基因表达数据推断方法,包括以下步骤:1)基因表达数据预处理,由不同平台的高维度小样本基因表达数据经处理得到大样本量的尺度统一、格式相同的基因表达数据;2)基于生成式对抗网络设计基因生成模型与基因判别模型;3)设计网络的目标函数与训练策略,对已经经过预处理的基因表达数据进行分包循环训练,通过网络的不断调整与优化得到最优生成模型。本发明提供一种具有良好的实用性和精度,采用基因生成模型和基因判别模型构建以及生成式对抗网络训练实现基因表达数据推断的方法。
技术领域
本发明属于生物信息技术领域,具体涉及一种基于生成对抗网络的基因表达全谱推断方法。
背景技术
如今,全基因表达谱的研究已经被广泛应用于疾病发现、遗传扰动、复杂疾病分类等领域。
基因表达谱可以描绘特定情况下组织、细胞中所表达的全套基因及其丰度,它从mRNA水平上反映出组织或细胞特异性表型和表达模式。通过对基因表达谱的生物信息学搜索、查询、比较和分析,可从中获取基因转录、基因调控、信号转导通路、核酸和蛋白质结构功能及其相互联系等相关信息。而基因表达全谱则包括了全基因组的表达数据,对其进行分析与特征发现对于生物信息领域以及医疗研究领域的发展都有着重要的影响与意义。
尽管全基因组表达谱的测量成本一直在下降,但是测定数千个样本的全基因表达谱仍然是非常昂贵的,目前只有少数资金充足的实验室能够进行大规模全基因表达谱分析。同时,大量数据表明,人体全基因组约22000个基因中的部分基因的表达谱之间存在高度关联。基于此假设,博德研究所的研究人员对于已测得的约1000个信息基因的表达谱,采用基于线性回归的计算模型对剩余约21000个目标基因的表达谱进行推断。由于基因表达谱之间存在广泛的非线性关联,该计算模型在推断精度上还受到一定限制。
生成式对抗网络(Generative Adversarial Networks,GAN)即一种概率生成模型。其目的为找出给定观测数据内部的统计规律,并且能够基于所得到的概率分布模型,产生全新的,与观测数据类似的数据。通过生成模型与判别模型的不断博弈与对抗达到网络的动态平衡,使生成模型能够生成接近真实样本的数据。
发明内容
本发明的目的是提供一种基于生成对抗网络的基因表达全谱推断方法,通过少量的信息基因数据经计算即可获得整条基因表达数据,该方法获取整条基因表达数据成本低、速度快、准确性高。
为实现上述发明目的,本发明提供以下技术方案:
一种基于生成对抗网络的基因表达数据推断方法,包括以下步骤:
(1)对高维度的基因表达数据进行去重、联合分位数归一化预处理,获得固定维度的基因表达数据,并将基因表达数据分成较小维度的信息基因数据和较大维度的目标基因数据;
(2)构建基因生成模型,所述基因生成模型包括依次连接的全链接层、交替的卷积层和反卷积层,利用所述全链接层对输入的信息基因数据转化为二维矩阵,利用卷积层和反卷积层分别对每层的输入矩阵进行降维特征提取和升维特征提取,并对最后反卷积层输出的输出矩阵进行sigmoid处理后,输出虚拟目标基因数据;
(3)构建基因判别模型,所述基因判别模型包括交替的卷积层和最大池化层、全链接层,利用所述的卷积层和最大池化层分别对每层的输入矩阵进行升维特征提取和降维特征提取,利用所述全链接层对最后最大池化层的输出矩阵进行全链接计算得到每条虚拟目标基因数据的概率值;
(4)对抗训练由所述基因生成模型和所述基因判别模型构成的生成对抗网络,具体地,每条包含信息基因数据和目标基因数据的基因表达数据作为一个训练样本,利用每个训练样本对所述生成对抗网络进行两阶段训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810444012.1/2.html,转载请声明来源钻瓜专利网。