[发明专利]一种高维数据半监督分类方法有效
申请号: | 202110285595.X | 申请日: | 2021-03-17 |
公开(公告)号: | CN113033641B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 叶枫旭;余志文;陈俊龙 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 监督 分类 方法 | ||
1.一种高维数据半监督分类方法,其特征在于,包括以下步骤:
1)输入训练数据集,为高维数据集;
2)对数据归一化,消除不同特征量纲不同的影响,同时提升后续优化学习的速度;
3)初始化回归矩阵子空间投影矩阵其中d为样本的特征数,c为样本类别数,表示d行c列的实数矩阵;初始化W的低秩分解矩阵其中表示c行c列的实数矩阵;初始化相似度矩阵参数矩阵其中n为样本数量,表示n行n列的实数矩阵;初始化偏置向量其中表示c行1列的实数矩阵;
4)子空间学习:根据提出的子空间学习目标函数,推导低秩分解矩阵B,参数矩阵C和子空间投影矩阵A的最优解;由于提出的目标函数涉及多个优化变量,所以用交替优化的方法,迭代更新B、C、A,逐步优化,提升子空间质量,进而学习到最优的表现样本本质特征的子空间;子空间学习过程如下:
定义子空间学习的目标函数为:
其中,tr(·)为矩阵的迹,表示矩阵的F-范数,为样本矩阵,表示d行n列的实数矩阵,为回归矩阵,为子空间投影矩阵,是W的低秩分解矩阵,是参数矩阵;α,θ,β为可调节的参数;
将目标函数分别对B、C、A求偏导,能够得各个变量的更新公式;接着,按以下要求更新各个变量:
a、根据公式B=ATW更新B;
b、根据公式C=(XTAATX+I)-1XTAATX更新C;
c、按以下公式循环更新子空间投影矩阵A:At+1=qf(At+G),直至收敛;
其中,I为单位矩阵,t代表第t轮迭代,At表示第t轮迭代时A的取值,At+1表示第t+1轮迭代时A的取值,G表示目标函数的梯度,G=-2(X(αL+θ(I-C)(I-C)T)XTA-βWBT),qf(·)表示的是QR分解;
5)从样本子空间和样本标签空间这两个方面综合学习样本相似度矩阵;将样本定义为图的节点,将样本间的相似度定义为图的边,样本相似度矩阵的学习过程即为图的构建过程;
6)在步骤4)子空间学习和步骤5)相似度矩阵学习的基础上,学习半监督线性回归分类器,即学习回归矩阵W和偏置向量b;
7)循环进行步骤4)至步骤6),迭代学习各个变量,直至收敛;当收敛的时候,子空间学习、图的构建和分类器学习这三个过程也就得到了联合最优解;
8)对测试样本进行分类,假设输入的测试样本为x,样本类别数为c,则预测标签predict(x)为:
其中,(WTx+b)i表示向量(WTx+b)的第i个元素;
9)计算分类准确率:输入测试样本的标签,与预测结果进行对比,计算出最后的分类准确率,由于使用的测试样本为高维数据,不存在不平衡数据,所以只采用分类准确率来评判效果。
2.根据权利要求1所述的一种高维数据半监督分类方法,其特征在于:在步骤2)中,数据归一化步骤是:获取第r行数据相对应的最大值X(r)max和最小值X(r)min,将第d行数据根据如下的公式进行转换:
其中,为第r行第i个数据,为更新之后的数据,n为数据集中样本数量,d为样本的特征数,i∈{1,2,...,n},r∈{1,2,...,d}。
3.根据权利要求1所述的一种高维数据半监督分类方法,其特征在于:在步骤3)中,初始化方法为:初始化回归矩阵为全零矩阵;初始化W的低秩分解矩阵为全零矩阵;初始化相似度矩阵和参数矩阵为全零矩阵;初始化偏置向量为全零向量;初始化子空间投影矩阵A=qf(R)为正交矩阵;其中,是一个随机矩阵,每个元素都在区间[0,1],qf(·)表示的是QR分解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110285595.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置