[发明专利]基于生成对抗网络的基因表达全谱推断方法有效
申请号: | 201810444012.1 | 申请日: | 2018-05-10 |
公开(公告)号: | CN108595916B | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 陈晋音;郑海斌;王桢;应时彦;李南;施朝霞 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 曹兆霞 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 基因 表达 推断 方法 | ||
1.一种基于生成对抗网络的基因表达数据推断方法,包括以下步骤:
(1)对高维度的基因表达数据进行去重、联合分位数归一化预处理,获得固定维度的基因表达数据,并将基因表达数据分成维度为900的信息基因数据和维度为90*90的目标基因数据;
(2)构建基因生成模型,所述基因生成模型包括依次连接的全连接层、两组交替的卷积层和反卷积层,卷积层的卷积核为3*3矩阵,步长为1,反卷积层卷积核为3*3矩阵,步长为2,利用所述全连接层对输入的信息基因数据升维到2025维再切片转化为二维矩阵,利用卷积层和反卷积层分别对每层的输入矩阵进行降维特征提取和升维特征提取,并对最后反卷积层输出的输出矩阵进行sigmoid处理后,输出90*90维的虚拟目标基因数据;
(3)构建基因判别模型,所述基因判别模型包括两组交替的卷积层和最大池化层、全连接层,卷积层的卷积核为5*5矩阵,步长为1或2,最大池化层的滑动窗口为3*3矩阵,其输入矩阵为90*90维的虚拟目标基因数据和90*90的目标基因数据,利用所述的卷积层和最大池化层分别对每层的输入矩阵进行升维特征提取和降维特征提取,利用所述全连接层对最后最大池化层的输出矩阵进行全连接计算得到每个输入矩阵的概率值;
(4)对抗训练由所述基因生成模型和所述基因判别模型构成的生成对抗网络,具体地,每条包含信息基因数据和目标基因数据的基因表达数据作为一个训练样本,利用每个训练样本对所述生成对抗网络进行两阶段训练;
在第一训练阶段中,以最大化所述基因判别模型的准确率为目标,固定所述基因生成模型的权重矩阵,利用所述基因生成模型对输入的信息基因数据生成虚拟目标基因数据后,利用基因判别模型计算输入的虚拟目标基因数据和目标基因数据的概率值;
在第二训练阶段中,以最小化所述基因判别模型的准确率为目标,固定所述基因判别模型的权重矩阵,利用所述基因生成模型对输入的信息基因数据生成虚拟目标基因数据后,利用基因判别模型计算输入的虚拟目标基因数据和目标基因数据的概率值;
(5)所述生成对抗网络训练结束后,将待测样本的信息基因数据输入到训练好的基因生成模型中,经计算获得预测目标基因数据,所述信息基因数据与预测目标基因数据组成待测样本的基因表达数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810444012.1/1.html,转载请声明来源钻瓜专利网。