[发明专利]一种蛋白质抗原表位的预测方法有效
| 申请号: | 201710516045.8 | 申请日: | 2017-06-29 |
| 公开(公告)号: | CN107341363B | 公开(公告)日: | 2020-09-22 |
| 发明(设计)人: | 羊红光;成彬;王程 | 申请(专利权)人: | 河北省科学院应用数学研究所 |
| 主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00 |
| 代理公司: | 石家庄冀科专利商标事务所有限公司 13108 | 代理人: | 李羡民;高锡明 |
| 地址: | 050081 河北省石家*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 蛋白质 抗原 预测 方法 | ||
一种蛋白质抗原表位的预测方法,所述方法首先从专业数据库中采集经实验验证的抗原表位序列信息及相关蛋白质的序列信息,构建用于学习训练的正负样本集合,采集氨基酸的理化性质特征信息;然后在样本集合中,采用机器学习算法训练出互补预测分类器组及一个单独的高性能分类器;最后运用互补预测分类器组获取第一候选表位集合,利用高性能分类器获取第二候选表位集合,并利用“倾向性打分方法”对候选表位集合中的序列进行打分排序。本发明在构造出多层分类结构的预测模型的基础上,利用多个具有互补能力的分类器对蛋白质抗原表位进行协同预测,该方法能显著提高蛋白质抗原表位预测的准确性,为精准、快速找到抗原表位提供了有效方法。
技术领域
本发明涉及一种能够对蛋白质抗原表位进行精准、快速预测的方法,属于生物技术领域。
背景技术
抗原表位是认识蛋白质抗原性的基础,正确而详细地绘制抗原表位图谱不仅有助于基础免疫学的研究,而且对生物活性药物及表位疫苗设计也具有重要的意义。在免疫系统中,B细胞和T细胞一道作用于人类的第二道防线“获得性免疫”过程,其作用是在免疫呈递过程中识别非己的抗原体,一旦发现入侵的抗原,两类细胞会产生各自的免疫效应。
抗原表位位置确定的传统方法有两种,即X-射线衍射方法和实验方法,这些方法的缺点是比较繁琐,工作量也非常大。随着计算机技术的发展和生物信息数据库的日益扩大,从已有数据中总结抗原表位的序列及结构特征,利用机器学习算法对表位进行筛选预测,再利用实验予以验证成为主流的技术路线。这种技术路线具有大幅节约成本,提高工作效率的优点。
利用计算机预测抗原表位是在氨基酸理化性质的基础上融合多个特征参数(如疏水性、亲水性、可及性、可变性、抗原性等)对表位点进行预测。机器学习算法以准确性高、效率高被广泛使用到表位预测中。机器学习算法预测抗原表位主要包括数据收集和处理、模型建立、参数优化和表位预测等步骤。常用的机器学习算法主要有:支持向量机器(SVMHC)、隐马尔可夫模型(HMM)和人工神经网络(ANN)等。这些算法的应用确实提升了抗原表位预测的效果,但也存在着运用单个算法很难取得较高的预测精度和训练样本数据选取的不科学等问题。目前国内外对于抗原表位的预测研究主要是通过互补预测能力的组合模型构造、科学的样本数据集合构造等来提升预测性能。这些研究多是利用现有预测工具的组合实验来发现具有互补预测能力的分类器组合,虽然这样的做法能够在一定程度上提升预测性能,但目前人们仍没有找到一种更为有效的预测方法。
发明内容
本发明的目的在于针对现有技术之弊端,提供一种蛋白质抗原表位的预测方法,为精准、快速找到抗原表位提供有效方法。
本发明所述问题是以下述技术方案解决的:
一种蛋白质抗原表位的预测方法,所述方法首先从专业数据库中采集经实验验证的抗原表位序列信息及相关蛋白质的序列信息,构建用于学习训练的正负样本集合,利用氨基酸的理化性质作为特征进行学习与预测;然后在样本集合中,采用机器学习算法训练出互补预测分类器组及一个高性能分类器;最后运用互补预测分类器组获取第一候选表位集合,利用高性能分类器获取第二候选表位集合,并利用“倾向性打分方法”对候选表位集合中的序列进行打分排序;
预测按以下步骤进行:
a.数据采集:从IEDB数据库中甄选表位数据信息,在Uniport蛋白质数据库中查找采用表位样本的蛋白质一级序列信息,从中完善表位样本数据及抽出非表位样本数据,构建用于学习训练的正负样本集合,利用氨基酸的疏水性、可及性等理化性质特征信息,将样本中序列的每个氨基酸、相邻三氨基酸的疏水性与可及性的均值组成特征矩阵作为训练的输入;
b.互补预测分类器组的训练:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北省科学院应用数学研究所,未经河北省科学院应用数学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710516045.8/2.html,转载请声明来源钻瓜专利网。





