[发明专利]一种数据分类方法在审

专利信息
申请号: 202110651152.8 申请日: 2021-06-10
公开(公告)号: CN113378928A 公开(公告)日: 2021-09-10
发明(设计)人: 李晓;杜辉;翟之博 申请(专利权)人: 西安电子科技大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 西安正华恒远知识产权代理事务所(普通合伙) 61271 代理人: 傅晓
地址: 710071 陕*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 分类 方法
【说明书】:

发明公开了一种数据分类方法,应用于包括源域和目标域的系统中,首先确定出所述源域中源域数据在公共子空间中对应的源域数据映射类原型矩阵,然后确定出所述目标域中目标域数据在所述公共子空间中对应的目标域已知类映射类原型矩阵,所述源域数据映射类原型矩阵包括源域已知类映射类原型矩阵和源域未知类映射类原型矩阵,然后基于所述源域数据映射类原型矩阵和所述目标域已知类映射类原型矩阵确定所述目标域未知类映射类原型矩阵,最后根据所述目标域未知类映射类原型矩阵确定所述目标域未知类数据中每一个样本的类别标签,实现了在具有大量源域已知类数据和源域未知类数据的情况下,对目标域未知类数据进行准确分类,且避免了域偏移问题。

技术领域

本发明属于信息分类技术领域,具体涉及一种数据分类方法。

背景技术

随着计算机技术及信息技术的发展,在分类领域中,目标数据的数量和种类越来越多,通常将待分类的领域称为目标域,而具有大量标记样本的辅助领域称为源域,一般源域和目标域之间是存在差异的,这种差异称为域差异,目前对于目标域中的分类任务或其他任务是将在源域中学习到的知识等应用在目标域,以完成目标域中的分类任务或其他任务,在此过程中,由于域差异的存在,通常会遇到一系列的问题,即为域偏移问题。

现有技术中有基于域适应对目标域中未知类数据进行分类的方案,但在该方案中缺少目标域中未知类数据,不能直接用于解决域偏移问题。

现有技术中还有一种零样本对抗学习方案,用以对没有训练样本的未知类数据进行分类,其使用已知类数据的标签以及已知类与未知类之间的语义关系来训练零样本学习模型,以完成未知类数据的分类,但在该模型中已知类数据和未知类数据之间没有交集,该方案是基于已知类数据中的样本及其语义表示来训练生成器,然后给定未知类数据的类原型,生成伪造的未知类数据集,该方案不适用于在有大量的源域已知类数据和源域未知类数据的情况下对目标域未知类数据进行分类。

因此,如何在具有大量源域已知类数据和源域未知类数据的情况下,对目标域未知类数据进行分类,且避免域偏移问题,是本领域技术人员有待解决的技术问题。

发明内容

本发明的目的是为了解决现有技术无法在具有大量源域已知类数据和源域未知类数据的情况下,对目标域未知类数据进行分类,同时无法避免域偏移的技术问题,提出了一种数据分类方法。

本发明的技术方案为:一种数据分类方法,应用于包括源域和目标域的系统中,所述源域中的源域数据包括多个不同类别的源域已知类数据和多个不同类别的源域未知类数据,所述目标域中的目标域数据包括目标域未知类数据和多个不同类别的目标域已知类数据,所述方法包括以下步骤:

S1、确定出所述源域数据在公共子空间中对应的源域数据映射类原型矩阵,确定出所述目标域数据在所述公共子空间中对应的目标域已知类映射类原型矩阵,所述源域数据映射类原型矩阵包括源域已知类映射类原型矩阵和源域未知类映射类原型矩阵;

S2、基于所述源域数据映射类原型矩阵和所述目标域已知类映射类原型矩阵确定所述目标域未知类映射类原型矩阵;

S3、根据所述目标域未知类映射类原型矩阵确定所述目标域未知类数据中每一个样本的类别标签。

进一步地,所述源域已知类数据和所述目标域已知类数据的类别数量和类别相同,所述源域未知类数据的类别为已知,单个所述源域已知类数据包含多个对应类别的样本,单个所述源域未知类数据包含多个对应类别的样本,单个所述目标域已知类数据包含多个对应类别的样本,所述目标域未知类数据包含多个未知类别的样本。

进一步地,所述S1具体包括以下分步骤:

S11、根据预设神经网络获取确定所述源域数据对应的源域样本特征矩阵,根据所述预设神经网络确定所述目标域对应的目标域样本特征矩阵,所述源域样本特征矩阵包括源域已知类样本特征矩阵和源域未知类样本特征矩阵,所述目标域样本特征矩阵包括目标域已知类样本特征矩阵和目标域未知类样本特征矩阵;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110651152.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top