[发明专利]基于复空间多视角特征融合的膜蛋白亚细胞位置定位方法无效
| 申请号: | 201310227091.8 | 申请日: | 2013-06-08 |
| 公开(公告)号: | CN103324933A | 公开(公告)日: | 2013-09-25 |
| 发明(设计)人: | 於东军;胡俊;杨健;吴小伟;沈红斌;戚湧;唐振民;杨静宇 | 申请(专利权)人: | 南京理工大学常熟研究院有限公司 |
| 主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 215513 江苏省苏州市*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 空间 视角 特征 融合 膜蛋白 细胞 位置 定位 方法 | ||
1.基于复空间多视角特征融合的膜蛋白亚细胞位置定位方法,其特征在于包括以下三个步骤:
第一步:多视角特征提取:基于蛋白质的氨基酸组成信息和氨基酸序列顺序信息,提取伪氨基酸组成成分特征PseAAC;使用PSI-BLAST获取待定位蛋白质序列的进化信息PSSM,然后从PSSM提取基于自相关变换的位置特异性得分矩阵特征PSSM-ACT;
第二步:先对第一步中提取的两种特征进行并行特征组合,得到的特征位于复空间;然后,使用广义主分量分析对组合后的特征进行降维,得到融合后的特征;
第三步:建立定位预测模型,使用基于优化证据理论的K近邻分类器OET-KNN作为定位预测模型,预测膜蛋白的亚细胞位置。
2.根据权利要求1所述的基于复空间多视角特征融合的膜蛋白亚细胞位置定位方法,其特征在于:在所述第一步中对于一个由 个氨基酸组成的蛋白质,通过PSI-BLAST程序可得到其特定位置得分矩阵PSSM,该矩阵为行20列;然后对PSSM抽取自相关变换的位置特异性得分矩阵特征PSSM-ACT;其次,基于蛋白质的氨基酸组成信息和氨基酸序列顺序信息,抽取伪氨基酸组成成分特征PseAAC。
3.根据权利要求1或2所述的蛋白质膜蛋白亚细胞定位预测方法,其特征在于:使用广义的主成分分析方法GPCA对并行融合后的特征向量在复空间进行降维处理,在降低计算量的同时,消除数据中的噪音。
4.根据权利要求2所述的蛋白质膜蛋白亚细胞定位预测方法,其特征在于:多视角特征提取从待定位的膜蛋白质序列中抽取出伪氨基酸组成成分特征PseAAC,该特征是一个维的特征向量,前20个分量是经典的氨基酸组成成分,后面的个分量是该膜蛋白的阶氨基酸次序相关性特征,是用到的氨基酸属性的种类;从待定位的膜蛋白质序列中抽取基于自相关变换的位置特异性得分矩阵特征PSSM-ACT,具体步骤如下:
第一步,使用PSI-BLAST软件获取待定位膜蛋白的原始位置特异性得分矩阵(PSSM),表示为,如式(1)所示意:
(1)
第二步,对进行归一化处理,用和分别表示第行中的20个得分的平均值和标准差,即:
(2)
(3)
归一化后PSSM为,其中通过下式获得:
(4)
长度为的膜蛋白规范化后的PSSM可以表示为:
(5)
第三步,先按式(6)计算该膜蛋白的20维的PSSM组成成分特征:
(6)
其中,
(7)
然后,在上计算阶相关性特征:
(8)
其中,
, (9)
那么,基于自相关变换的位置特异性得分矩阵特征(PSSM-ACT)表示如下:
(10)
根据权利要求1或4所述的蛋白质膜蛋白亚细胞定位预测方法,其特征在于:所述的并行多视角特征融合,获得PseAAC和PSSM-ACT两种特征之后,先使用并行组合的方式对两种特征向量进行特征组合,得到一个复特征:
PseAAC和PSSM-ACT两个特征空间,和分别是是特征空间A和B的维数,为训练样本空间,对于给定的膜蛋白样本,它的PseAAC和PSSM-ACT特征分别、和、,并行将这两个特征进行组合:
(11)
其中,是一个虚数单位,当和维数不相等时,在组合之前,将维数低的那个向量用0补齐,直到两个向量维数相等为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学常熟研究院有限公司,未经南京理工大学常熟研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310227091.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:小便标本瓶
- 下一篇:一种自行车车把转角灵活性测试装置





