[发明专利]一种蛋白质糖化位点鉴定方法有效
申请号: | 201910061890.X | 申请日: | 2019-01-23 |
公开(公告)号: | CN109726510B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 杨润涛;陈金桂;张承进;张丽娜;宋勇 | 申请(专利权)人: | 山东大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G06K9/62 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 264200 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白质 糖化 鉴定 方法 | ||
1.一种蛋白质糖化位点鉴定方法,其特征在于,所述方法包括:
收集糖化位点训练数据集,从所述糖化位点训练数据集中提取肽链P=A-ηA-(η-1)...A-2A-1KA1A2...Aη-1Aη,K为赖氨酸,η是赖氨酸上游或下游的氨基酸数量,A为20种天然氨基酸之一;
采用20维二进制编码表示所述肽链中的氨基酸,将所述肽链转换为20(2η+1)维数字矢量;其中:当所述肽链中赖氨酸上游或下游的氨基酸数量小于η时,使用符号X对扩展所述肽链;X的20维二进制编码为00 000 000 000 000 000 000,X的可及表面积为0,X的二级结构概率均为0;
计算所述肽链中氨基酸的可及表面积;
计算所述肽链中氨基酸的二级结构概率;
计算所述肽链的灰色关联度;
获取所述肽链的特征数字向量,所述特征数字向量包括所述20(2η+1)维数字矢量、所述肽链中氨基酸的可及表面积、所述肽链中氨基酸的二级结构概率和所述肽链的灰色关联度;
基于最大相关性最小冗余算法从所述特征数字向量中筛选若干特征,获得最佳特征集;
根据所述最佳特征集,基于支持向量机训练获得预测器;
基于所述预测器鉴定蛋白质糖化位点。
2.根据权利要求1所述的蛋白质糖化位点鉴定方法,其特征在于,η=11。
3.根据权利要求1所述的蛋白质糖化位点鉴定方法,其特征在于,所述方法还包括:
收集糖化位点测试数据集,从所述糖化位点测试数据集中提取测试肽链;
根据所述测试肽链,通过灵敏度SEN、特异性SPC、准确率ACC和马氏相关系数MCC评估所述预测器。
4.根据权利要求3所述的蛋白质糖化位点鉴定方法,其特征在于,所述方法还包括:
调整所述最佳特征集的特征数量,根据调整后最佳特征集,基于支持向量机训练获得预测器,找寻使准确率ACC较高的预测器。
5.根据权利要求4所述的蛋白质糖化位点鉴定方法,其特征在于,所述方法还包括:
当所述预测器的准确率ACC较高时,统计所述最佳特征集中各特征种类的占有量,获取对所述预测器影响最大的特征种类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910061890.X/1.html,转载请声明来源钻瓜专利网。