[发明专利]一种基于协同表示的样本不平衡分类方法有效
| 申请号: | 202110287823.7 | 申请日: | 2021-03-17 |
| 公开(公告)号: | CN112862000B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 杨猛;黄俊凯 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 协同 表示 样本 不平衡 分类 方法 | ||
1.一种基于协同表示的样本不平衡分类方法,其特征在于,包括以下步骤:
S1:获取样本不平衡的数据集;
S2:在样本不平衡的数据集中选择方差最大的类作为基类,并计算各类别的权重;
S2.1:将样本不平衡的数据集中方差最大的类别j作为基类;
S2.2:优化除类别j外的各类别i的重构项:
S2.3:根据各类别i的重构项的优化结果计算各类别i的重构误差ei:
基于协同表示带权重的分类器的目标函数为
其中,W=diag(w),diag(·)是将向量变换成对角矩阵的函数,wi表示第i类的样本的权重,为优化目标函数后得到的编码向量,X=[X1,X2,…,Xk]为样本不平衡的数据集,K为类别总数,y为要分类的样本,α=[α1,α2,…,αK],αi是对应类别i的编码向量,λ为重构系数;
S2.4:根据各类别i的重构误差计算各类别i的权重wi;
通过以下公式计算各类别i的权重wi:
wi=-γ·σ[10·a(ei)-b]+1+γ
其中,wj=1;γ为一个超参数,用于调节权重的分布;K为类别总数;
S3:根据各类别的权重构建基于协同表示带权重的分类器;
S4:通过基于协同表示带权重的分类器对样本不平衡的数据集中的数据进行分类。
2.根据权利要求1所述的一种基于协同表示的样本不平衡分类方法,其特征在于,在步骤S2.2中,通过以下公式优化各类别i的重构项:
其中,表示第i类的优化结果,表示第i类的数据,d为每条数据的特征数,ni为该类样本数,也就是说样本不平衡的数据集X=[X1,X2,…,XK]的每一列为一个样本,Xj表示第j类的数据,Aji表示第i类的重构项,λ为重构系数。
3.根据权利要求1所述的一种基于协同表示的样本不平衡分类方法,其特征在于,在步骤S2.3中,通过以下公式计算各类别i的重构误差ei:
其中,表示第i类的数据,d为每条数据的特征数,ni为该类样本数,也就是说样本不平衡的数据集X=[X1,X2,…,XK]的每一列为一个样本,Xj表示第j类的数据,表示第i类的优化结果,numel(Xi)表示Xi中元素个数,K为类别总数。
4.根据权利要求1所述的一种基于协同表示的样本不平衡分类方法,其特征在于,还包括通过以下步骤对目标函数进行优化:
将α替换成W-1β并且让则目标函数变成以下形式:
这样目标函数是凸函数,得到解析解
最后计算W-1β获得
5.根据权利要求1所述的一种基于协同表示的样本不平衡分类方法,其特征在于,步骤S4包括以下步骤:先对需要分类的样本y进行编码:然后计算所有类别i的重构误差ei(y);
其中,α=[α1,α2,…,αK],αi是类别i的编码向量,K为类别总数。
6.根据权利要求5所述的一种基于协同表示的样本不平衡分类方法,其特征在于,通过以下公式计算重构误差ei(y):
其中,表示第i类的数据,d为每条数据的特征数,ni为该类样本数,为类别i优化后得到的编码向量。
7.根据权利要求5或6所述的一种基于协同表示的样本不平衡分类方法,其特征在于,重构误差ei(y)最少的类别即为样本y的所属类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110287823.7/1.html,转载请声明来源钻瓜专利网。





