[发明专利]基于解析型字典学习的多模态模式分类方法在审
| 申请号: | 201710512836.3 | 申请日: | 2017-06-29 |
| 公开(公告)号: | CN107392233A | 公开(公告)日: | 2017-11-24 |
| 发明(设计)人: | 郭艳卿 | 申请(专利权)人: | 大连理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 大连非凡专利事务所21220 | 代理人: | 闪红霞 |
| 地址: | 116000 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 解析 字典 学习 多模态 模式 分类 方法 | ||
技术领域
本发明涉及一种模式分类技术,尤其是一种可提高分类精确率的基于解析型字典学习的多模态模式分类方法。
背景技术
模式分类技术是模式识别学科中极为重要的理论,已广泛应用于各个领域,如生物身份认证、手势识别、数据挖掘、信息检索、信号处理等。常规的模式分类技术主要包含两个主要过程,即训练过程和测试过程。训练过程有提取训练样本的特征及建立分类模型;测试过程为提取测试样本及利用训练阶段得到的分类模型对测试样本进行分类预测。
随着多媒体技术迅速发展,一个主体广泛存在多个模态的信息,例如网页有链接和内容的两种模态信息,一个人有各个角度的图像信息等,利用多模态数据间的互补信息,基于多模态场景的技术可以更好地进行模式分类任务。然而处理多模态数据同样存在挑战,包括不同模态间存在的语义鸿沟,同模态特征与同类别特征间的空间近邻结构模糊和同类特征具有一定分散度等,都影响着多模态方法的性能。
稀疏表示理论与行为识别的结合是近些年被提出的。稀疏表示理论是将待预测的样本用训练集中的少量样本进行线性组合表示,然后根据线性组合的系数进行分类判决,达到预测其类别的目的。稀疏表示理论的核心思想是:首先构造一个过完备字典,其中包含足够的具有代表性的样本,然后对于任意一个测试样本(一般是一个向量),用这个字典中少数几个样本的线性组合进行表示,这样就可以得到一个非零元素很少的编码系数向量,实现最终的稀疏表示。
稀疏表示的性能在很大程度上依赖于字典的学习方法,在稀疏表示理论发展的初期,大多采用预设的固定字典,如:训练集特征组成的字典、Curvelet基组成的字典、Gabor基组成的字典等,这样的字典在不同数据集上的重构效果不一,在不同数据集中的识别准确率也有很大波动。因此,根据训练数据集自适应学习得到的字典往往比预设的固定字典更加符合行为识别的需求。
为了利用字典学习解决识别问题,研究者们将传统的字典学习方法修正为适合分类识别的监督字典学习方法。监督字典学习方法大致可以分为两类:一类是直接学习具有判决力的字典;另一类是稀疏化编码系数,使稀疏编码作为新的特征具有区分性,继而使得到的字典具有判决力。前者主要是利用重构误差来进行最终的分类识别,后者主要是利用稀疏编码系数作为新的特征用于分类识别。
作为字典学习的另外一个主流方向,解析型字典学习模型引起了国内外学者的高度关注。解析型字典是综合型字典的对偶形式,综合型字典学习的是一组用于线性组合表示的基,而解析型字典学习的是一个映射矩阵,使得信号经过映射以后的表示是稀疏的。解析型字典学习模型具有良好的信号表示能力,并且,其训练阶段的优化问题易于求解,测试阶段测试速度十分快捷。
然而,目前的解析型字典学习方法不能够解决多模态模式分类问题。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种可提高分类精确率的基于解析型字典学习的多模态模式分类方法。
本发明的技术解决方案是:一种基于解析型字典学习的多模态模式分类方法,包括多模态特征提取、模型训练及分类判决,其特征在于:
所述多模态特征提取是提取个样本不同模态的特征,使每个样本均得到种特征列向量,即样本原始数据矩阵;然后对所得到样本原始数据矩阵进行列归一化预处理;
所述模型训练的求解模型为:
(1)
式(1)中:
是含有个样本的第个模态的原始数据矩阵;是对应第个模态的解析型字典;是对应第个模态的编码稀疏;是线性分类器,其中,表示样本类别个数;是的串联;是分类器的回归目标矩阵;是标量常数,取值范围;是关于解析型字典的约束集合;是对编码系数稀疏度的约束;是回归目标矩阵的每一列中,正确索引位置与错误索引位置值的差;为第个样本点正确位置的索引,为第个样本点非正确位置的索引;
基于交替搜索策略,交替最小化优化求解(1)的目标函数:
a. 保持,和不变,更新,将对的约束具化成log-det正则项加到目标函数中,通过公式推导,得到关于的闭式解;
b. 保持,,不变,更新,令目标函数关于的一阶偏导数为零,得到关于的闭式解;
c. 保持,,不变,更新,其中包含n个独立的子问题;引入通过学习得到的参数,再应用KKT条件,得到关于每个子问题的解;
d. 保持,,不变,更新,先求解,然后提取其对应位置的块矩阵并且通过硬门限算子稀疏处理得到;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710512836.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浮选工况分类方法和系统
- 下一篇:一种字符识别结果的错误标定方法和装置





