[发明专利]一种用于亚细胞蛋白质定位的多视角多分类方法在审
| 申请号: | 202011183968.4 | 申请日: | 2020-10-29 |
| 公开(公告)号: | CN112418272A | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 钟光正;肖燕珊;刘波 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G16B15/00;G16B40/00 |
| 代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 孔祥健 |
| 地址: | 510062 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 细胞 蛋白质 定位 视角 分类 方法 | ||
本发明公开了一种用于亚细胞蛋白质定位的多视角多分类方法,首先训练优化学习分类器模型,然后通过优化后的学习分类器模型预测蛋白质在细胞内的位置;而在训练优化学习分类器模型时,对亚细胞蛋白质定位的训练数据进行多视角分析,将含有多视角的训练数据映射到同一个特征空间中进行SVDD计算,计算过程中,对视角增加权重,通过权重将多视角问题转化为单视角问题求解。本发明与单视角方法相比,具有更高的准确度。
技术领域
本发明涉及亚细胞蛋白质定位的技术领域,尤其涉及到一种用于亚细胞蛋白质定位的多视角多分类方法。
背景技术
亚细胞蛋白定位,即蛋白质在细胞内的位置,是蛋白的关键功能特征之一。由于需要大规模的基因组分析,因此需要一种自动高效的蛋白质亚细胞定位预测方法。
而异常检测(outlier detection),也叫做离群点检测,假设所有的训练数据来自同一类。因此,异常检测算法为目标数据获得了一个紧凑的边界。一个对象的训练集和检测(新)对象像这个数据描述可用于异常值检测来检测异常对象从一个数据集。通常这些异常值数据显示异常大的或小的特征值相比于其他培训对象。一般来说,经过训练的分类器或回归器只能为接近训练集的输入数据提供可靠的估计。它在故障检测、可靠性分析、疾病诊断、机器故障检测、网络入侵检测、医疗诊断、信用评分、自动货币验证、动态身份验证等多种应用中都是一项重要的工作。
其中,由Tax和Duin提出的支持向量数据描述(SVDD,support vector datadescription)被公认为是一种强大的异常检测工具。它基于寻找围绕目标数据的紧凑描述的想法。描述是一个超球体(球心μ,半径R),用于以最小的超球体包含大多数目标数据。在高维特征空间中使用核技巧可以获得更灵活的数据描述。与支持向量机相似,数据描述是由少量的称为支持向量的训练数据来确定的。SVDD被广泛用于检测异常值。
但从机器学习的角度来看,蛋白质定位的数据集有几个特点:该数据集类太多,属于“多标签”数据集,且过于“不平衡”(每个类的数据数量差异较大),对于SVDD这种单视角方法来说,其不能充分利用多视角数据进行学习,最终效果不如多视角方法。
发明内容
本发明的目的在于克服现有技术的不足,提供一种用于亚细胞蛋白质定位的多视角多分类方法,将异常检测拓展,应用于蛋白质定位(多分类)问题,确保多视角的信息都可以被有效充分地利用,且遵循以下两个原则:1、consensus principle(共识准则):尽量保证多个视角的分类结果一致。2、complementary principle(互补准则):每个视角都拥有一些其他视角没有的信息,各个视角互相补充;从而使得亚细胞蛋白质定位的精度更高。
为实现上述目的,本发明所提供的技术方案为:
一种用于亚细胞蛋白质定位的多视角多分类方法,训练优化学习分类器模型,然后通过优化后的学习分类器模型预测蛋白质在细胞内的位置;而在训练优化学习分类器模型时,对亚细胞蛋白质定位的训练数据进行多视角分析,将含有多视角的训练数据映射到同一个特征空间中进行SVDD计算,计算过程中,对视角增加权重,通过权重将多视角问题转化为单视角问题求解。
进一步地,S1、训练优化学习分类器模型,在亚细胞蛋白质定位训练数据集中,将数据集分为目标数据集和一个标签为负的数据集,通过交叉验证的方法找到目标数据的最优边界;
S2、计算每一类li的隶属度;对于测试数据点xt使用如下评分函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011183968.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:焊球排布单元及封装芯片
- 下一篇:一种用于快速互瞄的蜗轮蜗杆传动装置





