[发明专利]一种数据分类方法在审
| 申请号: | 202110651152.8 | 申请日: | 2021-06-10 |
| 公开(公告)号: | CN113378928A | 公开(公告)日: | 2021-09-10 |
| 发明(设计)人: | 李晓;杜辉;翟之博 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 西安正华恒远知识产权代理事务所(普通合伙) 61271 | 代理人: | 傅晓 |
| 地址: | 710071 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 分类 方法 | ||
本发明公开了一种数据分类方法,应用于包括源域和目标域的系统中,首先确定出所述源域中源域数据在公共子空间中对应的源域数据映射类原型矩阵,然后确定出所述目标域中目标域数据在所述公共子空间中对应的目标域已知类映射类原型矩阵,所述源域数据映射类原型矩阵包括源域已知类映射类原型矩阵和源域未知类映射类原型矩阵,然后基于所述源域数据映射类原型矩阵和所述目标域已知类映射类原型矩阵确定所述目标域未知类映射类原型矩阵,最后根据所述目标域未知类映射类原型矩阵确定所述目标域未知类数据中每一个样本的类别标签,实现了在具有大量源域已知类数据和源域未知类数据的情况下,对目标域未知类数据进行准确分类,且避免了域偏移问题。
技术领域
本发明属于信息分类技术领域,具体涉及一种数据分类方法。
背景技术
随着计算机技术及信息技术的发展,在分类领域中,目标数据的数量和种类越来越多,通常将待分类的领域称为目标域,而具有大量标记样本的辅助领域称为源域,一般源域和目标域之间是存在差异的,这种差异称为域差异,目前对于目标域中的分类任务或其他任务是将在源域中学习到的知识等应用在目标域,以完成目标域中的分类任务或其他任务,在此过程中,由于域差异的存在,通常会遇到一系列的问题,即为域偏移问题。
现有技术中有基于域适应对目标域中未知类数据进行分类的方案,但在该方案中缺少目标域中未知类数据,不能直接用于解决域偏移问题。
现有技术中还有一种零样本对抗学习方案,用以对没有训练样本的未知类数据进行分类,其使用已知类数据的标签以及已知类与未知类之间的语义关系来训练零样本学习模型,以完成未知类数据的分类,但在该模型中已知类数据和未知类数据之间没有交集,该方案是基于已知类数据中的样本及其语义表示来训练生成器,然后给定未知类数据的类原型,生成伪造的未知类数据集,该方案不适用于在有大量的源域已知类数据和源域未知类数据的情况下对目标域未知类数据进行分类。
因此,如何在具有大量源域已知类数据和源域未知类数据的情况下,对目标域未知类数据进行分类,且避免域偏移问题,是本领域技术人员有待解决的技术问题。
发明内容
本发明的目的是为了解决现有技术无法在具有大量源域已知类数据和源域未知类数据的情况下,对目标域未知类数据进行分类,同时无法避免域偏移的技术问题,提出了一种数据分类方法。
本发明的技术方案为:一种数据分类方法,应用于包括源域和目标域的系统中,所述源域中的源域数据包括多个不同类别的源域已知类数据和多个不同类别的源域未知类数据,所述目标域中的目标域数据包括目标域未知类数据和多个不同类别的目标域已知类数据,所述方法包括以下步骤:
S1、确定出所述源域数据在公共子空间中对应的源域数据映射类原型矩阵,确定出所述目标域数据在所述公共子空间中对应的目标域已知类映射类原型矩阵,所述源域数据映射类原型矩阵包括源域已知类映射类原型矩阵和源域未知类映射类原型矩阵;
S2、基于所述源域数据映射类原型矩阵和所述目标域已知类映射类原型矩阵确定所述目标域未知类映射类原型矩阵;
S3、根据所述目标域未知类映射类原型矩阵确定所述目标域未知类数据中每一个样本的类别标签。
进一步地,所述源域已知类数据和所述目标域已知类数据的类别数量和类别相同,所述源域未知类数据的类别为已知,单个所述源域已知类数据包含多个对应类别的样本,单个所述源域未知类数据包含多个对应类别的样本,单个所述目标域已知类数据包含多个对应类别的样本,所述目标域未知类数据包含多个未知类别的样本。
进一步地,所述S1具体包括以下分步骤:
S11、根据预设神经网络获取确定所述源域数据对应的源域样本特征矩阵,根据所述预设神经网络确定所述目标域对应的目标域样本特征矩阵,所述源域样本特征矩阵包括源域已知类样本特征矩阵和源域未知类样本特征矩阵,所述目标域样本特征矩阵包括目标域已知类样本特征矩阵和目标域未知类样本特征矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110651152.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





