[发明专利]基于黎曼核字典学习算法的视觉分类方法在审
申请号: | 201910830476.0 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110689049A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 许淑华;祝汉灿;齐鸣鸣;王会敏 | 申请(专利权)人: | 绍兴文理学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06F17/16 |
代理公司: | 33285 绍兴市寅越专利代理事务所(普通合伙) | 代理人: | 胡国平 |
地址: | 312000 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 黎曼流形 字典学习 字典原子 算法 嵌入 局部信息 局部约束 视觉分类 标签 构建 字典 保留 矩阵 线性分类器 测试样本 常规算法 迭代更新 欧氏空间 视觉数据 数学模型 算法优化 稀疏编码 正定矩阵 分类 流形 对称 学习 优化 | ||
本发明涉及一种基于黎曼核字典学习算法的视觉分类方法,包括首先对视觉数据使用对称正定矩阵描述,并将其表示为黎曼流形上的点;其次借助于黎曼核,在黎曼流形中构建学习字典的图拉普拉斯矩阵,保留了该流形空间中字典原子的局部信息,而不是像常规算法一样在欧氏空间中保留字典原子的局部信息;接着,在黎曼流形空间中构建能够保留学习字典判别信息的字典原子的标签嵌入项,通过局部约束标签嵌入算法建立黎曼流形空间中的稀疏编码和字典学习数学模型;再次,结合凸优化方法,给出了局部约束标签嵌入黎曼核字典学习算法;最后,构造一个迭代更新算法优化目标,并利用线性分类器完成测试样本的分类。该视觉分类方法在分类精度上获得了较大的提升。
技术领域
本发明涉及图像处理技术领域,尤其涉及视觉分类技术,具体是指一种基于黎曼核字典学习算法的视觉分类方法。
背景技术
最近,稀疏编码字典表示广泛应用于视觉分类。作为稀疏编码的基本问题,字典学习吸引广泛关注。关于稀疏编码和字典学习的一些综述论文详见文献(Z.Zhang,Y.Xu,J.Yang,X.Li,D.Zhang,A Survey of Sparse Representation:Algorithms andApplications,IEEE Access,3,490-530,2016,Mehrdad J.Gangeh,Ahmed K.Farahatc,AliGhodsid,Mohamed S.Kamel,“Supervised Dictionary Learning and SparseRepresentation-A Review,”arXiv:1502.05928v1[cs.CV],1-60,20Feb 2015)。通常来说,字典学习的主要目的是从训练样本中学习到字典原子。测试样本能够由学习到字典原子稀疏表示,视觉分类任务基于重构误差或稀疏系数进行分类。
以前的许多算法(如,Jingcheng Ke,Yali Peng,Shigang Liu,Zengguo Sun,XiliWang,“A novel grouped sparse representation for face recognition,”MultimediaTools and Applications,vol.78,no.6,pp.7667–7689,Mar.2019.Jianquan Gu,HaifengHu,Haoxi Li,Local Robust Sparse Representation for Face Recognition WithSingle Sample per Person,IEEE/CAA Journal of Automatica Sinica,,VOL.5,NO.2,547-554,MARCH 2018)使用原始的训练样本作为字典原子稀疏重构测试样本,相比许多知名的人脸识别算法,获得不错的分类结果。最近,许多工作表明从训练样本中学习字典在许多视觉应用例如图像恢复、图像分类中获得更好的性能。K-SVD(M.Aharon,M.Elad,andA.Bruckstein,“K-SVD:An algorithm for designing overcomplete dictionaries forsparse representation,”IEEE Trans.Signal Process.,vol.54,no.11,pp.4311–4322,Nov.2006.)算法是著名字典学习算法之一。实际上,K-SVD是广义的k-均值聚类算法(Z.Jiang,Z.Lin,and L.S.Davis,“Learning a discriminative dictionary for sparsecoding via label consistent K-SVD,”in Proc.IEEE Conf.CVPR,Providence,RI,USA,Jun.2011,pp.1697–1704.)。然而,由于KSVD的目标函数只包括重构误差项和稀疏项,学习到的字典判别能力弱,因而K-SVD不适合分类任务。为了进一步加强学习字典的判别能力,Zhang和Li(Q.Zhang and B.Li,“Discriminative K-SVD for dictionary learning inface recognition,”in Proc.IEEE Conf.CVPR,San Francisco,CA,USA,Jun.2010,pp.2691–2698)提出了判别K-SVD(D-KSVD)算法。虽然这些字典学习算法获得很好的视觉分类结果,但是由于数据样本可能位于嵌入高维空间的非线性流形中(Ying S,Wen Z,Shi J,Peng Y,Peng J,Qiao H.,Manifold Preserving:An Intrinsic Approach forSemisupervised Distance Metric Learning,IEEE Trans Neural Netw LearnSyst.2018Jul;29(7):2731-2742.doi:10.1109),这些算法一般没有保留局部信息,他们不是最优的,分类性能有所下降。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于绍兴文理学院,未经绍兴文理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910830476.0/2.html,转载请声明来源钻瓜专利网。