[发明专利]基于局部几何视觉短语描述的鉴别性人脸姿态识别方法有效
申请号: | 201310289408.0 | 申请日: | 2013-07-10 |
公开(公告)号: | CN103310208A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 田春娜;高新波;陆阳;王华青;蒲倩;李东阳;王代富;郑红;张相南;杨二昆 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/64 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 710071 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 局部 几何 视觉 短语 描述 鉴别 性人脸 姿态 识别 方法 | ||
1.基于局部几何视觉短语描述的鉴别性人脸姿态识别方法,其包括基于人脸局部特征建立词袋模型,其特征在于:通过局部几何视觉短语引入词袋模型中单词的空间信息,并用图像的特征向量表示图像中包含的几何视觉短语,用向量的内积统计共现的图像特征数目,通过共现的特征数构成训练图像核矩阵,将所述训练图像核矩阵输入到支撑向量机分类器训练得到人脸姿态分类器。
2.如权利要求1所述的基于局部几何视觉短语描述的鉴别性人脸姿态识别方法,其特征在于包括以下步骤:
(1)检测图像中有限的角点和斑点并形成特征点集合,用尺度不变特征变换(Scale invariant feature transform,SIFT)描述子来描述这些特征点;
(2)对由对齐的人脸姿态图像组成的训练集训练集中所有人脸图像上的SIFT特征点进行K-均值聚类,得到C个聚类中心,定义每一个聚类中心为一个视觉单词,C个视觉单词构成词袋模型的词典,将n个具有特定空间分布的单词组成的集合称为nth阶特征fn,并用向量表示,所述特征fn为图像的几何视觉短语;
(3)通过两幅图像中nth阶特征向量的内积计算共现的nth阶特征数目,并用核函数表示,对核进行归一化降低图像中单词数目引起的偏差;
(4)对核进行权重化强调高阶特征的重要性;
(5)计算训练图像两两间的核并构成训练图像的核矩阵,然后将得到的核矩阵输入到支撑向量机(Support vector machine,SVM)分类器中,训练人脸姿态判别分类器;
(6)计算测试图像与每幅训练图像的核函数,组成核矩阵,将核矩阵输入到训练好的分类器中,得到待测图像的人脸旋转角度分类。
3.根据权利要求2所述的基于局部几何视觉短语描述的鉴别性人脸姿态识别方法,其特征在于所述的步骤(2)按如下过程进行:
(2a)利用K-均值聚类将步骤(1)提取的所有SIFT描述子进行余弦距离下的聚类,得到C个聚类中心,定义每个聚类中心为一个视觉单词,得到人脸图像的词典Σ={w1,w2,...,wC},其中,w表示视觉单词。将任一图像I中的SIFT特征用向量量化的方式表示成词典中的一个单词,这样,图像I可由视觉单词的集合来表示,即I={(w1,r1),(w2,r2),...,(wm,rm)},其中ri表示视觉单词wi的位置;
(2b)对于图像I={(w1,r1),(w2,r2),...,(wm,rm)},定义由n个具有相同空间分布的单词组成的集合为nth阶几何视觉短语fn,不同的单词或n个单词的不同空间分布均代表不同的短语,在图像I中nth阶几何视觉短语fn用向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310289408.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:工作微博管理系统及方法
- 下一篇:一种基于单轴加速度传感器的运动行为识别方法