[发明专利]一种基于张量全局‑局部保持投影的数据降维的人脸识别方法有效
| 申请号: | 201310574562.2 | 申请日: | 2013-11-15 |
| 公开(公告)号: | CN103605985B | 公开(公告)日: | 2017-02-01 |
| 发明(设计)人: | 罗利佳;包士毅;高增梁 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 张量 全局 局部 保持 投影 数据 识别 方法 | ||
技术领域
本发明涉及模式识别和机器学习领域,具体涉及一种基于张量全局-局部保持投影的数据降维方法。
背景技术
在当今信息时代,得益于数据获取和数据存储技术的长足发展,高维数据在众多领域大量涌现,例如气候数据、基因数据、遥感数据、金融数据以及语音、图像和文本数据等。其中部分数据不仅是高维的,而且是高阶的,即每个数据样本具有高阶张量(二阶以上)的结构形式,如由多幅图像组成的图像数据集。数据降维是指按照一定的准则将数据由高维约减到低维,消除数据的冗余性,得到数据特征的低维等价表达,以便于探知数据的本质规律。目前,数据降维在模式识别、机器学习和计算机视觉等诸多研究领域中扮演着极其重要的角色。
传统的数据降维方法绝大多数是针对由一阶张量(即向量)数据样本构成的数据集提出的,是向量型数据降维方法,例如主成分分析(PCA)、独立成分分析(ICA)、线性判别分析(LDA)、局部保持投影(LPP)及局部线性嵌入(LLE)等。当利用这些向量型降维方法处理由二阶张量(即矩阵)数据样本构成的数据集时,通常需要先将二阶张量数据样本展开成向量,然后才能进行数据降维。然而,数据展开会破坏原数据样本的空间结构,易引起信息损失、小样本和维数灾难等问题,严重影响数据降维的效果。因此,部分学者提出了张量型数据降维方法,其中代表性的方法包括:二维PCA(2DPCA)、二阶二维PCA(2D2PCA)和张量子空间分析(TSA)等。张量型降维方法无需将数据样本展开成向量,充分利用了数据的结构信息及相关性,克服了小样本问题,因而在性能上优于向量型降维方法。
数据的结构包含全局结构和局部结构两部分内容,全局结构描述了数据的外部整体特征,而局部结构反映了数据的内在组织方式,二者相辅相成,缺一不可。然而,现有的张量型数据降维方法仅关注了数据的全局结构(如2DPCA和2D2PCA)或数据的局部结构(如TSA)二者之一,并没有对二者进行综合考虑,因而降维后的数据难以完整、准确地反映原数据的本质特征,易造成数据信息的丢失和误读,严重影响数据降维的效果。
发明内容
为了克服现有的张量型数据降维方法仅关注数据的全局结构或局部结构、降维效果差的不足,本发明提供了一种能够同时挖掘数据的全局和局部结构、降维效果良好的基于张量全局-局部保持投影的数据降维方法。
本发明所采用的技术方案如下:
一种基于张量全局-局部保持投影的数据降维方法,包括以下步骤:
1)输入待降维的样本集X={X1,X2,…,Xi,…,Xn},其中每个样本Xi具有二阶张量的结构形式,即Xi∈RK×J,式中R表示实数域,K和J分别是样本的行维数和列维数;
2)计算各样本对(Xi,Xj)之间的距离d(Xi,Xj);
3)划分各样本点Xi的邻域Ω(Xi),得到其近邻点和非近邻点;
4)根据各样本对(Xi,Xj)之间的近邻和非近邻关系,分别计算权值Wij和
式中||·||表示矩阵的Frobenius范数,参数σ为正实数,可根据经验确定。
利用权值Wij和建立邻接权矩阵W和非邻接权矩阵
5)建立对应于数据局部结构保持的目标函数JTLocal(U,V):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310574562.2/2.html,转载请声明来源钻瓜专利网。





