[发明专利]一种基于分类效用的开集分类方法有效

专利信息
申请号: 201911352812.1 申请日: 2019-12-25
公开(公告)号: CN111191033B 公开(公告)日: 2023-04-25
发明(设计)人: 蔡毅;李泽婷 申请(专利权)人: 华南理工大学
主分类号: G06F16/35 分类号: G06F16/35;G06F18/241
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 裴磊磊
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分类 效用 方法
【说明书】:

发明公开了一种基于分类效用的开集分类方法,包括步骤:输入数据集,并对数据集进行预处理;采用特征提取器将数据转换为特征;采用训练集的特征训练一个可增量学习少样本分类器;对于一条新数据,对其进行预处理后采用特征提取器提取特征;将新数据的特征输入到分类器中,寻找已知类别中分类分数最高的一个类别,并计算分类效用;将新数据单独作为一个类别,采用新数据的特征计算其分类效用;比较已知类别与新类别情况下的分类效用大小,更新分类器;重复提取特征并计算分类效用的步骤,增加分类器处理的类别数据。本发明解决了开集分类中的未知类别数据识别和新类别的引入问题,并结合增量学习来学习新类别,增强分类器。

技术领域

本发明涉及开集分类领域,尤其涉及一种基于分类效用的开集分类方法。

背景技术

面对现实世界的开集分类是一个极具挑战的任务。在现实世界中,人类期待分类器能够对实时的数据正确地进行分类。由于新数据中可能包含新类别,因此一个在现实世界中的分类器应该能够识别出不属于已知类别的数据,并引入新类别,增量学习新类别。传统闭集分类技术,假设未知数据全部来自于已知类别,将未知的数据分类到现有类别,因此该项技术只能对来自于已知类别的数据进行分类。然而在现实世界中,这样的假设往往是不成立的。随着时间推移,分类体系可能会发生改变,例如新类别的出现。传统分类器对新类别样本数据只能将其归类到已知类别中,不但无法发现新类别,而且造成已知类别的语义偏移。

一个开集分类器,应该具备以下三个方面的能力:(1)识别不属于现有类别的样本;(2)发现(1)中数据中的新类别;(3)增量学习新类别。目前关于开集分类的研究只能解决三者之一,不能系统地解决开集分类问题。其中,目前识别不属于现有类别的样本的技术集中在两个方向:学习一个元分类器,学习现有类别的特征,拒绝不属于现有类别的数据;缩减决策空间,减小开放空间风险。传统的聚类方法可以从未知类别的数据中发现新类别,但是聚类结果不能保证和已知现有分类体系保持一致。增量学习是在学习新信息中的新知识同时记住旧知识,其中最大的挑战是解决灾难性遗忘,即忘却以前学过的知识。目前许多学者提出基于记忆的增量学习方法,其中包括显式存储训练样本、规范化参数更新、为训练数据建模生成模型,但这些方法假设新增类别拥有足够多的训练样。Ren等人结合元学习,提出了可增量学习少样本类别的增量学习方法,即注意吸引子网络。

分类效用是一种衡量分类优良的指标,目的是最大化同一类别中的两个对象具有相同属性值的概率,以及来自不同类别的对象具有不同属性值的概率。人类在对新事物进行分类时,总是无意识地,自发地将新事物分类到类别层级结构中的某一类别层级中,认知心理学家称之为基本层次分类。认知心理学家发现基本层次分类的最大的性质是类内相似度最大,类间相似度最小。因此当分类效用最大时,分类结果是最符合人类认知的。在开集分类问题最重要的问题之一是判断何时应该引入新类别,分类效用作为一种衡量分类优良的指标,可以用于评判引入新类别的分类好坏,作为一种是否引入新类别的指标,找出最符合人类认知的分类结果。

发明内容

本发明的目的在于克服现有技术的不足,提供一种基于分类效用的开集分类方法。本发明利用认知心理学中的分类效用作为开集分类任务中引入新类别的指标,解决了开集分类中的未知类别数据识别和新类别的引入问题,并结合增量学习来学习新类别,增强分类器,来应对新数据中可能出现的新类别。

本发明的目的能够通过以下技术方案实现:

一种基于分类效用的开集分类方法,包括步骤:

输入数据集,并对数据集进行预处理;

采用特征提取器将数据转换为特征;

采用训练集的特征训练一个可增量学习少样本分类器;

对于一条新数据,对其进行预处理后采用特征提取器提取特征;

将新数据的特征输入到分类器中,寻找已知类别中分类分数最高的一个类别,并计算分类效用;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911352812.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top