[发明专利]DNA6mA修饰类别的预测方法、装置、设备和存储介质有效
申请号: | 202110606033.0 | 申请日: | 2021-05-25 |
公开(公告)号: | CN113409891B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 邹权;张昊宇 | 申请(专利权)人: | 电子科技大学长三角研究院(衢州) |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G06F18/2411 |
代理公司: | 成都创新引擎知识产权代理有限公司 51249 | 代理人: | 向群 |
地址: | 324003 浙江省衢*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | dna6ma 修饰 类别 预测 方法 装置 设备 存储 介质 | ||
1.一种DNA6mA修饰类别的预测方法,其特征在于,包括:
获取DNA6mA特征数据集;
基于后缀树的双序列比对模型得到所述DNA6mA特征数据集中各个序列间的相似度矩阵,包括:
将第一输入序列构造为第一后缀树;
获取与所述第一输入序列进行比对的第二输入序列;
基于所述第一后缀树和所述第二输入序列,采用LCS模型确定所述第一输入序列和所述第二输入序列的公共子串;
基于预设合格标准,从所述公共子串中剔除不合格子串;
采用Needleman-Wunsch模型将所述第一输入序列和第二输入序列中未匹配的子串进行比对,并基于比对结果形成比对结果序列;
基于所述公共子串的长度和所述比对结果序列长度,确定所述第一输入序列和所述第二输入序列之间的相似度;
对所述相似度矩阵进行对数化处理,获得所述各个序列间的距离矩阵;
对所述距离矩阵进行高斯化处理,获得满足正定性要求的距离矩阵;
将所述满足正定性要求的距离矩阵作为支持向量机的自定义核矩阵,并基于支持向量机模型,对DNA6mA修饰类别进行预测。
2.如权利要求1所述的预测方法,其特征在于,所述DNA6mA特征数据集包括正例数据集和反例数据集,所述正例数据集为DNA6mA序列,所述反例数据集为非DNA6mA序列。
3.一种DNA6mA修饰类别的预测装置,其特征在于,包括:
第一获取单元,用于获取DNA6mA特征数据集;
第一确定单元,用于确定所述DNA6mA特征数据集中各个序列间的相似度矩阵,
所述第一确定单元,包括:
第一确定子单元,用于基于后缀树的双序列比对模型得到所述DNA6mA特征数据集中各个序列间的相似度矩阵;
所述第一确定单元,包括:
第一构造子单元,用于将第一输入序列构造为第一后缀树;
第一获取子单元,用于获取与所述第一输入序列进行比对的第二输入序列;
第二确定子单元,用于基于所述第一后缀树和所述第二输入序列,采用LCS模型确定所述第一输入序列和所述第二输入序列的公共子串;
第一剔除单元,用于基于预设合格标准,从所述公共子串中剔除不合格子串;
第一比对单元,用于采用Needleman-Wunsch模型将所述第一输入序列和第二输入序列中未匹配的子串进行比对,并基于比对结果形成比对结果序列;
第三确定子单元,用于基于所述公共子串的长度和所述比对结果序列长度,确定所述第一输入序列和所述第二输入序列之间的相似度;
对数处理单元,用于对所述相似度矩阵进行对数化处理,获得所述各个序列间的距离矩阵;
高斯处理单元,用于对所述距离矩阵进行高斯化处理,获得满足正定性要求的距离矩阵;
预测单元,用于将所述满足正定性要求的距离矩阵作为支持向量机的自定义核矩阵,并基于支持向量机模型,对DNA6mA修饰类别进行预测。
4.如权利要求3所述的DNA6mA修饰类别的预测装置,其特征在于,所述DNA6mA特征数据集包括正例数据集和反例数据集,所述正例数据集为DNA6mA序列,所述反例数据集为非DNA6mA序列。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-2任一所述的方法中的步骤。
6.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行时实现如权利要求1-2任一所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学长三角研究院(衢州),未经电子科技大学长三角研究院(衢州)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110606033.0/1.html,转载请声明来源钻瓜专利网。