[发明专利]基于元学习的生物活性肽预测方法及系统在审
申请号: | 202111256399.6 | 申请日: | 2021-10-27 |
公开(公告)号: | CN114067914A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 魏乐义;何文嘉 | 申请(专利权)人: | 山东大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B40/30;G16B30/00;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 朱忠范 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 生物 活性 预测 方法 系统 | ||
1.一种基于元学习的生物活性肽预测方法,其特征在于,包括:
获取待预测的生物活性肽序列信息;
利用通过最大化互信息与最小化交叉熵的联合优化改进的元学习算法预先训练好的预测模型对待预测的生物活性肽序列信息进行处理,获得生物活性肽的功能类型;其中,预先训练好的预测模型使用训练集训练得到,所述训练集包括多个生物活性肽序列以及标注生物活性肽功能类型的标签。
2.根据权利要求1所述的基于元学习的生物活性肽预测方法,其特征在于,预测模型的训练包括:肽序列被文本卷积神经网络进行样本嵌入;样本嵌入后通过平均属于相应功能类的原型嵌入产生不同肽类的原型;基于所述欧氏距离,确定每个肽序列属于各个功能类的概率分布;通过梯度下降算法对联合目标进行优化,迭代更新模型参数。
3.根据权利要求2所述的基于元学习的生物活性肽预测方法,其特征在于,最大化互信息包括,在元训练和元测试程序中,在支持集和查询集中最大化肽序列嵌入特征和类别标签之间的互信息,以利用无监督信息。
4.根据权利要求2所述的基于元学习的生物活性肽预测方法,其特征在于,计算样本嵌入和原型嵌入之间的欧式距离作为分类度量,从而评估嵌入和原型的正确性;将softmax归一化距离视为预测置信度。
5.根据权利要求2所述的基于元学习的生物活性肽预测方法,其特征在于,对于模型优化,在元训练过程中,根据最大似然估计,优化分类目标,即交叉熵损失,为模型优化参数提供监督信息。
6.根据权利要求2所述的基于元学习的生物活性肽预测方法,其特征在于,最终的优化目标是使交叉熵损失和最小化互信息损失的加权和最小。
7.根据权利要求1所述的基于元学习的生物活性肽预测方法,其特征在于,在模型测试过程中,对于每个新任务在获得查询序列的预测之后,根据支持集的监督损失和查询集的无监督损失来调整模型,以利用特定新任务的无监督互信息。
8.一种基于元学习的生物活性肽预测系统,其特征在于,包括:
获取模块,用于获取待预测的生物活性肽序列信息;
预测模块,用于利用通过最大化互信息与最小化交叉熵的联合优化改进的元学习算法预先训练好的预测模型对待预测的生物活性肽序列信息进行处理,获得生物活性肽的功能类型;其中,预先训练好的预测模型使用训练集训练得到,所述训练集包括多个生物活性肽序列以及标注生物活性肽功能类型的标签。
9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求1-7任一项所述的基于元学习的生物活性肽预测方法。
10.一种电子设备,其特征在于,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如权利要求1-7任一项所述的基于元学习的生物活性肽预测方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111256399.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高精度冲压模具
- 下一篇:一种手提纸袋生产设备及生产工艺