[发明专利]基于元学习的生物活性肽预测方法及系统在审
申请号: | 202111256399.6 | 申请日: | 2021-10-27 |
公开(公告)号: | CN114067914A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 魏乐义;何文嘉 | 申请(专利权)人: | 山东大学 |
主分类号: | G16B40/20 | 分类号: | G16B40/20;G16B40/30;G16B30/00;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 朱忠范 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 生物 活性 预测 方法 系统 | ||
本发明提供一种基于元学习的生物活性肽预测方法及系统,属于生物信息技术领域,获取待预测的生物活性肽序列信息;利用通过最大化互信息与最小化交叉熵的联合优化改进的元学习算法预先训练好的预测模型对待预测的生物活性肽序列信息进行处理,获得生物活性肽的功能类型。本发明能够统一预测多种的生物活性肽;基于Embedding技术而不基于特征工程和人工设计的特征,能够通过微调或推断等方式来预测多肽是否具有某种特定的功能活性;使用来自各种功能肽的少量样本,获取了各种功能之间的区别信息并表征功能差异,提高了下游功能肽预测效果,尤其是在小样本场景下与传统方法相比性能有显著提升。
技术领域
本发明涉及生物信息技术领域,具体涉及一种基于元学习的生物活性肽预测方法及系统。
背景技术
多肽通常由10-100个氨基酸组成,与传统化疗相比,功能活性肽具有以下优点:生物介体、显著的效力、高选择性和低毒性。从天然肽中提取的药物已经彻底改变了一些疾病的治疗,例如1型糖尿病。此后,越来越多的多肽类药物被发现。例如,一种基于抗血管生成肽(AAP)的药物,单克隆抗VEGF(血管内皮生长因子)抗体,可以抑制肿瘤血管生长,从而提高癌症患者的生存率。抗菌肽(ABPs)是先天免疫的效应分子,可以靶向细菌膜,通过细胞凋亡反应杀死细菌,其杀菌速度快于细菌的生长速度。抗结核肽(ATPs)由于其低免疫原性、低毒性和针对侵袭性病原体的靶向免疫反应的特点,已成为结核病治疗的候选药物。其他肽的生物活性包括抗癌和DPP IV抑制剂等。因此,发现新的潜在多肽生物活性对新药开发具有重要意义。
尽管肽类药物具有优异的优势,但全球市场上只有约80种肽类药物,约700种肽仍处于临床试验或临床前研究阶段。限制肽药物开发的主要原因之一是难以识别生物活性肽,这是肽药物发现管道中的关键步骤。为了促进肽类药物的发现,提出了基于机器学习的功能肽预测算法,并取得了一些进展。这种方法使模型能够区分功能性肽和非功能性肽,从而加速肽药物的开发。
近年来,已经开发出了几种基于机器学习的方法来识别各种生物活性肽。例如,Laengsri等人构建了TargetAntiAngio,一种基于序列的分类器,用于使用传统机器学习预测AAP。Wei等人开发了一系列预测因子,如ACPred FL、PEPred Suite和ACPred Fuse,以促进准确预测ACP的发展。Manavalan等人通过采用ERT算法对一个名为AtbPpred的预测工具进行建模,以识别ATP,从而提高了模型的鲁棒性和精度。至于神经肽,有人提出了一种称为NeuroPIpred的工具,通过特征工程来预测、设计和扫描昆虫神经肽。此外,各种用于预测其他种类的功能肽的计算方法相继被提出,如Deep AntiFP、iQSP、iUmami SCM、PreAIP、PSBP-SVM、THPep等。
尽管取得了很大进展,但仍然存在以下主要挑战。首先,许多基于机器学习的相关任务都受到样本数较少的影响。低容量标记样本(经实验验证的生物活性肽)无法支持传统的监督学习来训练鲁棒的高性能模型,容易导致过度拟合和泛化能力差的问题。其次,大多数现有的利用工程特性的方法都是针对特定的功能肽设计的;没有通用的计算方法可以同时准确预测不同肽的生物活性。更重要的是,它们不能支持看不见的(新的)肽生物活性发现,这也是监督学习的一个限制。第三,大多数基于机器学习的多肽预测器仍然依赖于人工设计的统计特征,这在很大程度上依赖于研究人员的先验知识。此外,人工设计的的特征无法捕获不同肽功能的高潜在非线性信息。重要的是,人工设计的的特征缺乏对不同肽功能预测任务的适应性。也就是说,他们可能在一项特定任务上表现良好,但在其他任务上表现不佳。此外,特征工程通常会产生数百维的特征向量,导致维数灾难。
发明内容
本发明的目的在于提供一种通过最大化互信息与最小化交叉熵的联合优化改进现有的元学习算法原型网络,不依赖于特征工程,能够通过微调或推断等方式来预测多肽是否具有某种特定的功能活性的基于元学习的生物活性肽预测方法及系统,以解决上述背景技术中存在的至少一项技术问题。
为了实现上述目的,本发明采取了如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111256399.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高精度冲压模具
- 下一篇:一种手提纸袋生产设备及生产工艺