[发明专利]一种基于序列和形状信息深度融合的模体挖掘方法有效
申请号: | 202110509316.3 | 申请日: | 2021-05-11 |
公开(公告)号: | CN113096733B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 黄德双;张寅东 | 申请(专利权)人: | 同济大学 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G06N3/08;G06N3/04 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 张雪 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 序列 形状 信息 深度 融合 挖掘 方法 | ||
1.一种基于序列和形状信息深度融合的模体挖掘方法,其特征在于,包括以下步骤:
S1、构建深度嵌入卷积神经网络模型,并对DNA序列和形状信息进行空间对齐混合,作为所述神经网络模型的输入;
S2、对所述深度嵌入卷积神经网络模型进行训练,得到模体绑定强度预测值;
S3、基于所述预测值与实际绑定强度之间的回归系数R2对所述构建的深度嵌入卷积神经网络模型性能进行评估;
所述深度嵌入卷积神经网络模型中,包括两个独立的卷积层,分别为第一卷积层和第二卷积层,所述第一卷积层用于处理DNA序列的输入,所述第二卷积层用于处理形状信息的输入;
所述S1中,通过拼接模式和加和模式,对所述DNA序列和形状信息进行空间对齐混合。
2.根据权利要求1所述的基于序列和形状信息深度融合的模体挖掘方法,其特征在于,在所述拼接模式下,若输入的DNA序列形式不同,则命名不同;在所述加和模式下,输入编码的形式不同,则命名也不同。
3.根据权利要求1所述的基于序列和形状信息深度融合的模体挖掘方法,其特征在于,所述S2中,在训练过程中,通过Glorot均匀初始化策略对所述深度嵌入卷积神经网络模型进行初始化,并使用Adam学习器优化模型参数,基于网格搜索策略寻找最优值。
4.根据权利要求1所述的基于序列和形状信息深度融合的模体挖掘方法,其特征在于,在所述深度嵌入卷积神经网络中增加丢失层,用于对抗模型训练过程中的过拟合问题。
5.根据权利要求1所述的基于序列和形状信息深度融合的模体挖掘方法,其特征在于,所述S3中,基于预测值与实际绑定强度之间的回归系数R2对所述构建的深度嵌入卷积神经网络模型性能进行评估,并采用五折交叉验证策略进行验证。
6.根据权利要求5所述的基于序列和形状信息深度融合的模体挖掘方法,其特征在于,所述回归系数R2的计算公式为:
其中,yi代表样本i的标签值(label),代表标签值的平均数,代表样本i的预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110509316.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度嵌入卷积神经网络的模体挖掘方法
- 下一篇:一种制备甲壳寡糖的方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置