[发明专利]一种深度迁移学习的不平衡分类集成方法有效

专利信息
申请号: 201710480452.8 申请日: 2017-06-22
公开(公告)号: CN107316061B 公开(公告)日: 2020-09-22
发明(设计)人: 陈琼;徐洋洋 申请(专利权)人: 华南理工大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 陈宏升
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 深度 迁移 学习 不平衡 分类 集成 方法
【说明书】:

发明公开的一种深度迁移学习的不平衡分类集成方法,包括以下步骤:建立辅助数据集;构建辅助深度网络模型和目标深度网络模型;训练辅助深度网络;将辅助深度网络的结构和参数迁移到目标深度网络;计算auprc值的乘积作为分类器的权值,对各个迁移分类器的分类结果加权集成,得到集成分类结果,作为集成分类器输出。本发明的方法,改进的平均精度方差损失函数APE和平均精度交叉熵损失函数APCE,在计算样本的损失代价时,动态调整样本的权值,对多数类样本赋予较少的权值,对少数类样本赋予更多的权值,由此训练得到的深度网络对少数类样本更加重视,更适用于不平衡数据的分类问题。

技术领域

本发明涉及机器学习中的深度学习、迁移学习和不平衡分类领域,尤其涉及到一种深度迁移学习的不平衡分类集成方法。

背景技术

传统的数据分类方法把不同类型的数据同等看待,致力于提高整体的分类准确度。但现实中存在很多数据分布不平衡的情况,因为有些样本或者是较少出现或者是收集代价高,使得某一类样本数量远远少于其它类样本数量,如疾病检测、破产预估、市场客户流失预测、软件缺陷预测等。这些情况下的异常数据类(少数类)只占正常数据类(多数类)的10%到20%,分布不平衡,甚至极度不平衡。传统的分类方法大多以数据分布基本均衡作为前提,以样本总体的分类准确率作为目标,这对要从庞大的样本中,寻找少量的异常样本的不平衡分类问题并不合适,因为当少数的异常样本都没有被正确识别时,总体分类准确率也可以很高。当数据分布不平衡,特别是错分类代价不同,错分少数类样本代价很高时,正确区分少数类样本显得尤其重要。因此不平衡数据分类问题成为备受关注的研究内容。

深度网络可以有效地提取数据的特征,迁移学习能够利用已经存在的相关任务或数据域的有标记数据处理目标任务或目标领域的问题。深度学习与迁移学习的结合称为深度迁移学习(Deep Transfer Learning,DTL),将相关领域数据训练的深度模型重用于目标领域,能够有效提取数据特征,提高对不平衡数据的分类能力。

深度迁移学习利用相关领域的辅助数据建立深度网络模型,通过深度网络学习相关领域辅助数据特征,将学习的辅助深度网络结构和特征迁移到目标领域。现有深度迁移学习存在不足:首先,特征迁移可能为目标学习带来好处,同时也可能是负特征迁移而影响目标学习;其次,深度网络结构迁移方法的选择,使得学习的过程耗费大量的时间和空间代价。深度迁移学习的集成方法可以解决深度网络结构迁移选择问题,使学习代价降到最低;同时,减少负特征迁移的影响,使正向特征迁移发挥最大作用。但由辅助数据学习到的深度网络迁移得到的分类器可能会倾向多数类,简单的集成可能会对分类器的倾向产生叠加效果,使得最终的集成分类器过度倾向多数类,无法实现不平衡分类的目标,因此本发明提出了一种用于不平衡数据分类的深度迁移集成方法。

发明内容

本发明的目的在于克服现有技术的缺点与不足,提供一种深度迁移学习的不平衡分类集成方法。

为实现上述目的,本发明所提供的技术方案为:

一种深度迁移学习的不平衡分类集成方法(Ensemble of Unbalanced DeepTransfer,EUDT),包括以下步骤:

(1)建立辅助数据集:

根据目标数据的特性,选择或者采集与目标任务相关的数据组成辅助数据集;

(2)构建辅助深度网络模型和目标深度网络模型:

确定深度网络的结构,构建辅助深度网络模型和目标深度网络模型;

(3)训练辅助深度网络:

(3-1)利用无标签的辅助数据样本对栈式自编码器进行预训练;

(3-2)利用有标签的辅助数据样本对步骤(3-1)训练得到的网络参数进行调整;

(4)将辅助深度网络的结构和参数迁移到目标深度网络:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710480452.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top