[发明专利]神经网络提取调控DNA组合模式的训练和可视化方法及系统有效
申请号: | 202110063192.0 | 申请日: | 2021-01-18 |
公开(公告)号: | CN112735514B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 汪小我;魏征 | 申请(专利权)人: | 清华大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/00;G16B40/00;G16B50/00;G06N3/04;G06N3/08;G06N3/12 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 李岩 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 提取 调控 dna 组合 模式 训练 可视化 方法 系统 | ||
1.一种神经网络提取调控DNA组合模式的训练和可视化方法,其特征在于,包括以下步骤:
S1,获取具有特定功能的DNA序列和不具有所述特定功能的DNA序列;
S2,对两种DNA序列进行标注,并将所述具有特定功能的DNA序列和所述不具有所述特定功能的DNA序列使用独热编码表示;
S3,搭建卷积神经网络,将标注后的DNA序列的独热编码作为输入,对应DNA序列标注为卷积神经网络输出的拟合值,对卷积神经网络进行训练,以使卷积神经网络识别DNA序列;
S4,通过NeuronMotif算法将训练后的卷积神经网络解耦,获得基因调控元件组合模块,并利用调控元件语法树进行表示和存储;
S41,对于卷积神经网络中的一个神经元,采集一个DNA序列新集合,所述DNA序列新集合中的不同DNA序列具有各种大小的神经元激活值;
S42,分别计算所述DNA序列新集合中的DNA序列在神经网络各层能够影响该神经元的所有神经元激活值;
S43,对所述DNA序列新集合进行划分得到多个DNA序列子集合;
S44,计算每个DNA序列子集合对应的基因功能元件组合模块的数学表示形式,并利用调控元件语法树对基因功能元件组合模块进行表示和存储;
S431,对于所述DNA序列新集合,从所述神经元所在层开始,从深层到浅层进行检测,若遇到最大池化层,则根据池化大小K,使用Kmeans算法根据所述DNA序列新集合的序列对应的该池化层浅一层神经元激活值特征,将所述DNA序列新集合聚成K类,每一类对应被划分的DNA序列子集合;
S432,将划分的DNA序列子集合都作为一个DNA序列新集合,从聚类发生层开始,再从深层到浅层进行检测,若遇到最大池化层,则根据池化大小K,使用Kmeans算法根据DNA序列新集合的序列对应的该池化层浅一层神经元激活值特征,将DNA序列新集合聚成K类,每一类对应被划分的DNA序列子集合;
S433,重复步骤S432直到第一层,得到所述多个DNA序列子集合。
2.根据权利要求1所述的方法,其特征在于,S1进一步包括:
S11,在使用生物实验手段标注的生物基因组上截取具有所述特定功能的DNA序列片段和不具有述特定功能的DNA序列片段。
3.根据权利要求1所述的方法,其特征在于,S1进一步包括:
S12,通过人工合成DNA序列片段分子,做任意类型的生物功能验证实验,确定其中具有所述特定功能的片段分子和不具有所述特定功能的片段分子。
4.根据权利要求1所述的方法,其特征在于,所述对两种DNA序列进行标注,包括:
将所述具有特定功能的DNA序列标注为正样本,所述不具有所述特定功能的DNA序列标注为负样本。
5.根据权利要求1所述的方法,其特征在于,S41进一步包括:
根据神经元接收域大小随机生成DNA序列,使用遗传算法优化所述DNA序列,优化目标为所述DNA序列的神经元激活值,遗传算法中对DNA序列的突变根据神经元激活值对DNA序列的独热编码输入的梯度大小作为概率进行抽样,除了保持DNA序列的交叉互换以外,还需要根据神经网络池化层结构进行循环位移,对遗传算法优化的中间结果DNA序列进行采样,采样的DNA序列不重复,采样的DNA序列组成各种激活的DNA序列集合。
6.根据权利要求1所述的方法,其特征在于,所述基因功能元件组合模块的计算表达式为E[E(X|Y)],其中,X为采样序列的one-hot编码对应的随机变量,Y是采样序列对应的激活值所表示的随机变量,Y与X之间的关系Y=f(X)由对应的神经元确定,其中随机变量Y的分布需要给定,是自由变量,随机变量X依赖于随机变量Y。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110063192.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有三轴补偿机构的工件抓取装置
- 下一篇:多节臂同步伸缩机构及消防车