[发明专利]基于生成对抗网络的基因表达全谱推断方法有效
申请号: | 201810444012.1 | 申请日: | 2018-05-10 |
公开(公告)号: | CN108595916B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 陈晋音;郑海斌;王桢;应时彦;李南;施朝霞 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于生成式对抗网络的基因表达数据推断方法,包括以下步骤:1)基因表达数据预处理,由不同平台的高维度小样本基因表达数据经处理得到大样本量的尺度统一、格式相同的基因表达数据;2)基于生成式对抗网络设计基因生成模型与基因判别模型;3)设计网络的目标函数与训练策略,对已经经过预处理的基因表达数据进行分包循环训练,通过网络的不断调整与优化得到最优生成模型。本发明提供一种具有良好的实用性和精度,采用基因生成模型和基因判别模型构建以及生成式对抗网络训练实现基因表达数据推断的方法。 | ||
搜索关键词: | 基于 生成 对抗 网络 基因 表达 推断 方法 | ||
【主权项】:
1.一种基于生成对抗网络的基因表达数据推断方法,包括以下步骤:(1)对高维度的基因表达数据进行去重、联合分位数归一化预处理,获得固定维度的基因表达数据,并将基因表达数据分成较小维度的信息基因数据和较大维度的目标基因数据;(2)构建基因生成模型,所述基因生成模型包括依次连接的全链接层、交替的卷积层和反卷积层,利用所述全链接层对输入的信息基因数据转化为二维矩阵,利用卷积层和反卷积层分别对每层的输入矩阵进行降维特征提取和升维特征提取,并对最后反卷积层输出的输出矩阵进行sigmoid处理后,输出虚拟目标基因数据;(3)构建基因判别模型,所述基因判别模型包括交替的卷积层和最大池化层、全链接层,利用所述的卷积层和最大池化层分别对每层的输入矩阵进行升维特征提取和降维特征提取,利用所述全链接层对最后最大池化层的输出矩阵进行全链接计算得到每条虚拟目标基因数据的概率值;(4)对抗训练由所述基因生成模型和所述基因判别模型构成的生成对抗网络,具体地,每条包含信息基因数据和目标基因数据的基因表达数据作为一个训练样本,利用每个训练样本对所述生成对抗网络进行两阶段训练;在第一训练阶段中,以最大化所述基因判别模型的准确率为目标,固定所述基因生成模型的权重矩阵,利用所述基因生成模型对输入的信息基因数据生成虚拟目标基因数据后,利用基因判别模型计算输入的虚拟目标基因数据和目标基因数据的概率值;在第二训练阶段中,以最小化所述基因判别模型的准确率为目标,固定所述基因判别模型的权重矩阵,利用所述基因生成模型对输入的信息基因数据生成虚拟目标基因数据后,利用基因判别模型计算输入的虚拟目标基因数据和目标基因数据的概率值;(5)所述生成对抗网络训练结束后,将待测样本的信息基因数据输入到训练好的基因生成模型中,经计算获得预测目标基因数据,所述信息基因数据与预测目标基因数据组成待测样本的基因表达数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810444012.1/,转载请声明来源钻瓜专利网。