[发明专利]一种结构化视图缺失数据的分类方法在审
申请号: | 201710990955.X | 申请日: | 2017-10-23 |
公开(公告)号: | CN107729942A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 杨燕;张熠玲;张晓博 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都点睛专利代理事务所(普通合伙)51232 | 代理人: | 葛启函 |
地址: | 610031 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种结构化视图缺失数据的分类方法。属于数据挖掘技术领域。该框架有两个阶段结构化视图缺失数据处理阶段、结构化视图缺失多任务多视图分类阶段。1.结构化视图缺失数据处理阶段构建样本图;确定权重;转换样本到特征映射空间;删除缺失视图。2.结构化视图缺失多任务多视图分类阶段选择合适分类器;训练分类器参数;将删除视图后的样本构造成完备数据集;利用提出的MMLE框架进行分类。本发明可用于实际场景中类似数据的信息不一致或原始数据保存过程中出现的数据缺漏,可以最大程度地提取原始数据特征,同时保留数据的分布及结构,大大提升了多任务多视图分类的性能及应用范围。 | ||
搜索关键词: | 一种 结构 视图 缺失 数据 分类 方法 | ||
【主权项】:
一种结构化视图缺失数据的分类方法,包括以下步骤:步骤一、结构化视图缺失的数据处理:同一任务下不同视图的数据之间图的构建,所有数据点之间权重的确定,所有视图的数据样本的拉普拉斯特征映射,结构化数据缺失的视图定位,删除缺失视图的相关值;(1)构建图,使用KNN算法来将所有的点构建成一个图,将每个点最近的K个点连上边,K是一个预先设定的值;这里没有采用全连通方法,因为使用KNN算法可以保证数据的稀疏性;(2)确定权重,确定点与点之间的权重大小,选用热核函数来确定,如果点i和点j相连,那么它们关系的权重设定为:其中,Xi和Xj分别为第i个和第j个对象;Wij为第i个对象与第j个对象之间的权重;e则为指数函数中的自然常数;(3)特征映射,计算拉普拉斯特征矩阵的特征值与特征向量,Ly=λDy,其中L是图拉普拉斯矩阵,λ是特征值,y是特征向量,D是对角阵,满足Dii=∑jWji,L=D‑W;设xi映射后的点为yi,则拉普拉斯特征映射的目标函数为:minΣij(yi-yj)2Wij]]>(4)对结构化数据缺失的视图进行定位,删除该视图相关的值,将其置0;忽略对于结构化视图缺失的数据,只考虑提取未缺失视图的特征,进而完成基于多任务多视图的缺失数据分类;步骤二、结构化视图缺失数据的多任务多视图分类:对删除缺失视图相关值后的目标函数进行更新,选择合适的分类器,训练分类器的相关参数,利用MMLE框架进行求解,得到结构化缺失数据的分类结果;包括以下处理步骤:(1)定义视图为V={v1,v2,......vm},任务为T={t1,t2,......tn},映射后的数据点为则完备数据的目标函数为:minΣijwt,ijv||yt,iv-yt,jv||2]]>其中,和分别表示任务t的第v个视图下的第i个和第j个数据点;表示在任务t的第v个视图中数据点i和j之间的权重;(2)定义结构化缺失数据的视图为vl,对于结构化数据缺失的情况,设该视图的数据全部无法获知,因此直接将与该视图相关的值删去置0,更新目标函数为:minv≠lΣijWt,ijv||yt,iv-yt,jv||2]]>(3)选择最佳分类器,如:KNN分类器对样本点进行分类,求出投影后的每个样本点之间的距离,确定每个数据点的k个邻居,划分类别,样本点的距离度量如下:Lp(yi,yj)=(Σl=1n|yi(l)-yj(l)|p)1p]]>其中,l表示样本数据的维度;p表示距离度量的范数;Lp(yi,yj)表示样本yi与yj之间的Lp距离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710990955.X/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置