[发明专利]一种基于自适应权重学习的补子空间表示非均衡分类方法在审

专利信息
申请号: 202211335234.2 申请日: 2022-10-28
公开(公告)号: CN115511003A 公开(公告)日: 2022-12-23
发明(设计)人: 李艳婷;王帅;刘岩;金军委;陶红伟;朱付保 申请(专利权)人: 郑州轻工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/16
代理公司: 北京睿智保诚专利代理事务所(普通合伙) 11732 代理人: 王卓
地址: 450001 河南省郑*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 自适应 权重 学习 空间 表示 均衡 分类 方法
【说明书】:

发明公开了一种基于自适应权重学习的补子空间表示非均衡分类方法,应用于数据分类技术领域,用于解决现有的分类技术无法高精度识别少数类样本的问题,方法包括以下步骤:对非均衡数据集进行预处理、获取每个训练样本的权重、基于补子空间计算得到非均衡分类模型、对非均衡分类模型求解得到最优表示系数、对测试样本集中测试样本的标签进行分类。本发明在协同表示模型中引入了由补子空间诱导的正则项,并且根据原始数据的类间和类内密度信息自适应地获取每个训练样本的权重,有效剔除了噪声以及离群点对分类结果的影响,为少数类样本赋予更大的权重,解决了现有的分类方法无法对少数类准确分类的缺陷。

技术领域

本发明涉及数据分类技术领域,更具体的说是涉及一种基于自适应权重学习的补子空间表示非均衡分类方法。

背景技术

现实生活中欺诈检测、网络入侵、信用风险识别等众多领域涉及到非均衡分类。目前的分类技术高度依赖数据的均衡分布,对少数类的识别率总是不能取得令人满意的结果。实际上少数类的误分类成本更高,例如,在信用评估中,信用差的用户远远少于信用好的用户,如果分类错误,可能造成银行贷款资金的重大损失。因此,在实际应用中,提高少数类样本的识别精度至关重要。

现有的非均衡分类方法可以大致分为基于算法层面和基于数据层面的方法。基于数据层面的方法主要是通过对少数类样本进行欠采样,对多数类样本采用过采样的方法使原本的非均衡数据集均衡化。但是,这些数据层面的方法都会对原始数据造成损害,并不会显著提高最终的识别精度。算法层面的方法比数据层面方法的性能更好,但是需要仔细的调整参数以获得最佳的分类性能。在众多算法层面的方法中,协同表示分类方法(Collaborative representation based classification,CRC)由于其自身简单、高效、以及极低的计算复杂度表现出极大的优势,然而协同表示分类方法很大程度上依赖于数据的均衡分布,无法准确的识别少数类样本。因此,如何提高少数样本的识别精度以及分类准确率是本领域技术人员亟需解决的问题。

发明内容

有鉴于此,本发明提供了一种基于自适应权重学习的补子空间表示非均衡分类方法,选用CRC作为基础模型,延续它已有的优势,同时提高CRC对少数类样本的分类准确率,解决现有的CRC无法准确识别少数类样本的问题。

为了实现上述目的,本发明提供如下技术方案:

一种基于自适应权重学习的补子空间表示非均衡分类方法,包括以下步骤:

S1、对总类别数为N的非均衡数据集进行预处理,获得训练样本集H以及测试样本集;

S2、基于密度获取训练样本集H中每个训练样本的权重;

S3、根据每个训练样本的权重,基于补子空间计算得到非均衡分类模型;

S4、对非均衡分类模型求解得到最优表示系数;

S5、根据最优表示系数的重构误差对测试样本集中测试样本的标签进行分类。

上述方法,可选的,S1具体为:

S11、通过交叉验证法将总类别数为N的非均衡数据集随机分为z份,选择其中e份作为原始训练集,f份作为原始测试集,e+f=z;

S12、将e份原始训练集和f份原始测试集随机交叉验证g次,得到g组原始训练样本集和g组原始测试样本集;

S13、将g组原始测试样本集和g组原始训练样本集转化为列向量,进行归一化处理,得到测试样本集和训练样本集。

可选的,S2具体为:

S21、获取每一类训练样本的个数Mik,Mik为第i个样本所属类别k中的样本总数,每个训练样本的初步权重为

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业大学,未经郑州轻工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211335234.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top