[发明专利]基于低秩稀疏矩阵分解、局部几何结构保持和类别信息最大统计相关的特征提取方法在审
申请号: | 201910062740.0 | 申请日: | 2019-01-23 |
公开(公告)号: | CN109871880A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 马争鸣;黎伟浚;吴荟彬;张国凯;刘洁 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及模式识别中特征提取相关问题,提出了一种基于低秩稀疏矩阵分解、局部几何结构保持和类别信息最大统计相关的特征提取方法。为了解决现有许多特征提取方法存在的问题,包括鲁棒性不足、没有利用数据的局部几何结构信息、没有利用数据的类别信息,本发明通过对一个总的目标函数的优化求解,实现对数据样本的特征提取,进而可以更有效率地进行下一步的数据处理。这个目标函数由三部分组成,包括低秩稀疏矩阵分解、流形学习以及有监督学习。本发明兼顾这三部分的特点,使特征提取尽可能地达到全局最优,提取出重要的、有判别力的特征,去除冗余信息。 | ||
搜索关键词: | 特征提取 局部几何结构 类别信息 稀疏矩阵 低秩 目标函数 分解 流形学习 模式识别 全局最优 冗余信息 数据样本 优化求解 数据处理 鲁棒性 去除 统计 监督 学习 | ||
【主权项】:
1.一种基于低秩稀疏矩阵分解、局部几何结构保持和类别信息最大统计相关的特征提取方法,其特征在于:A.对输入数据作低秩稀疏矩阵分解,分解为去噪数据矩阵和噪声矩阵,且要求去噪数据矩阵尽可能低秩、噪声矩阵尽可能稀疏,作用是数据清洗、提高鲁棒性;X是数据样本的特征空间,X={xi|xi∈RD,i=1,L,N}是N个样本的训练数据集,
低秩稀疏矩阵分解的目标函数为:
s.t.X=Z+E其中,参数λ≥0,
分别是清洗后的数据矩阵、噪声矩阵;||·||*是指矩阵的核范数,即矩阵奇异值的和;||·||1是指矩阵的L1范数,即矩阵所有元素的绝对值的和;B.令提取的特征保持数据的局部几何结构信息,作用是揭示数据潜在的拓扑结构,挖掘出蕴含在低维流形中的重要信息;Y={yn|yn∈Rd,n=1,L,N}是N个样本的提取的特征,d=D;保持数据的局部几何结构的目标函数为:
s.t.YYT=Id其中,tr(·)是矩阵的迹,L=[L1 L LN],
Sn是选择矩阵,选择出yn的近邻,使得Yn=YSn;IK+1是K+1维单位矩阵,Θn是清洗后的样本数据Z的局部坐标,
是其伪逆;C.令提取的特征与类别信息保持最大统计相关性,作用是利用类别信息,提高提取的特征的判别性;可以采用希尔伯特‑施密特独立性准则(HSIC)衡量提取的特征与类别信息的统计相关性;C是样本的类别空间,C是与X对应的类别集合矩阵,
c是样本的类别总数;令提取的特征与类别信息最大统计相关的目标函数为:
其中,
是中心化矩阵,
是N维的全1向量,
kC和kY是两个核函数;D.基于上述三点,总的目标函数如下:
s.t.X=Z+E,Z≥0其中,参数α,β,λ≥0;最终目的是根据训练集X和C,对目标函数优化求解,求得提取的特征Y*,用于分类任务,如kNN方法,根据分类任务的准确率迭代地调整参数等设置;然后利用这样的目标函数的模型,去掉有监督学习的部分,可以用于预测集数据的特征提取。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910062740.0/,转载请声明来源钻瓜专利网。