[发明专利]一种结构化视图缺失数据的分类方法在审

专利信息
申请号: 201710990955.X 申请日: 2017-10-23
公开(公告)号: CN107729942A 公开(公告)日: 2018-02-23
发明(设计)人: 杨燕;张熠玲;张晓博 申请(专利权)人: 西南交通大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 成都点睛专利代理事务所(普通合伙)51232 代理人: 葛启函
地址: 610031 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种结构化视图缺失数据的分类方法。属于数据挖掘技术领域。该框架有两个阶段结构化视图缺失数据处理阶段、结构化视图缺失多任务多视图分类阶段。1.结构化视图缺失数据处理阶段构建样本图;确定权重;转换样本到特征映射空间;删除缺失视图。2.结构化视图缺失多任务多视图分类阶段选择合适分类器;训练分类器参数;将删除视图后的样本构造成完备数据集;利用提出的MMLE框架进行分类。本发明可用于实际场景中类似数据的信息不一致或原始数据保存过程中出现的数据缺漏,可以最大程度地提取原始数据特征,同时保留数据的分布及结构,大大提升了多任务多视图分类的性能及应用范围。
搜索关键词: 一种 结构 视图 缺失 数据 分类 方法
【主权项】:
一种结构化视图缺失数据的分类方法,包括以下步骤:步骤一、结构化视图缺失的数据处理:同一任务下不同视图的数据之间图的构建,所有数据点之间权重的确定,所有视图的数据样本的拉普拉斯特征映射,结构化数据缺失的视图定位,删除缺失视图的相关值;(1)构建图,使用KNN算法来将所有的点构建成一个图,将每个点最近的K个点连上边,K是一个预先设定的值;这里没有采用全连通方法,因为使用KNN算法可以保证数据的稀疏性;(2)确定权重,确定点与点之间的权重大小,选用热核函数来确定,如果点i和点j相连,那么它们关系的权重设定为:其中,Xi和Xj分别为第i个和第j个对象;Wij为第i个对象与第j个对象之间的权重;e则为指数函数中的自然常数;(3)特征映射,计算拉普拉斯特征矩阵的特征值与特征向量,Ly=λDy,其中L是图拉普拉斯矩阵,λ是特征值,y是特征向量,D是对角阵,满足Dii=∑jWji,L=D‑W;设xi映射后的点为yi,则拉普拉斯特征映射的目标函数为:minΣij(yi-yj)2Wij]]>(4)对结构化数据缺失的视图进行定位,删除该视图相关的值,将其置0;忽略对于结构化视图缺失的数据,只考虑提取未缺失视图的特征,进而完成基于多任务多视图的缺失数据分类;步骤二、结构化视图缺失数据的多任务多视图分类:对删除缺失视图相关值后的目标函数进行更新,选择合适的分类器,训练分类器的相关参数,利用MMLE框架进行求解,得到结构化缺失数据的分类结果;包括以下处理步骤:(1)定义视图为V={v1,v2,......vm},任务为T={t1,t2,......tn},映射后的数据点为则完备数据的目标函数为:minΣijwt,ijv||yt,iv-yt,jv||2]]>其中,和分别表示任务t的第v个视图下的第i个和第j个数据点;表示在任务t的第v个视图中数据点i和j之间的权重;(2)定义结构化缺失数据的视图为vl,对于结构化数据缺失的情况,设该视图的数据全部无法获知,因此直接将与该视图相关的值删去置0,更新目标函数为:minv≠lΣijWt,ijv||yt,iv-yt,jv||2]]>(3)选择最佳分类器,如:KNN分类器对样本点进行分类,求出投影后的每个样本点之间的距离,确定每个数据点的k个邻居,划分类别,样本点的距离度量如下:Lp(yi,yj)=(Σl=1n|yi(l)-yj(l)|p)1p]]>其中,l表示样本数据的维度;p表示距离度量的范数;Lp(yi,yj)表示样本yi与yj之间的Lp距离。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710990955.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top