[发明专利]基于几何图神经网络的蛋白质信号肽的预测方法及装置有效
申请号: | 202011177674.0 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112002378B | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 华权高;舒芹;赵愿安 | 申请(专利权)人: | 武汉金开瑞生物工程有限公司 |
主分类号: | G16B40/10 | 分类号: | G16B40/10;G16B15/00;G16B30/00 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 王振宇 |
地址: | 430000 湖北省武汉市东湖开发区高新大道*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 几何 神经网络 蛋白质 信号肽 预测 方法 装置 | ||
1.一种基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,包括如下步骤:
获取数据集中的蛋白质序列,提取其中信号肽的字符序列;
对所述信号肽进行特征提取,得到所述信号肽的序列进化特征、物理化学特征、结构特征、统计特征;
将进化特征、物理化学特征、结构特征、统计特征进行融合,得到多维向量;所述进化特征、结构特征、统计特征分别为PSSM特征、PSAIA特征、HMM特征;
根据所述字符序列和所述多维向量构建信号肽的特征图:将信号肽的字符序列作为节点,相邻节点的边通过多维向量的距离进行度量;确定多维向量的距离的阈值,剪除无效节点和边;遍历所有有效节点和边,构建特征图;
将所述特征图作为几何图神经网络模型的输入,训练所述几何图神经网络直至其误差低于阈值,保存所述几何图神经网络模型并将其用于预测待预测氨基酸序列中是否含有信号肽片段。
2.根据权利要求1所述的基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,所述信号肽的字符序列表示为:
;
其中,
3.根据权利要求1所述的基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,所述几何图神经网络包括低聚合层、高聚合层、非线性变换层,
所述低聚合层用于聚合节点在一种关系下的邻居信息;
所述高聚合层用于聚合所述低聚合层的邻居信息;
所述非线性变化层用于拼接所述低聚合层与所述高聚合层所述的邻居信息。
4.根据权利要求3所述的基于几何图神经网络的蛋白质信号肽的预测方法,其特征在于,所述几何图神经网络模型的表示为:
其中,表示虚拟节点的特征,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉金开瑞生物工程有限公司,未经武汉金开瑞生物工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011177674.0/1.html,转载请声明来源钻瓜专利网。