[发明专利]一种基于Gabor小波和灰度共生矩阵的人脸表情识别方法有效
| 申请号: | 201510370315.X | 申请日: | 2015-06-29 |
| 公开(公告)号: | CN105005765B | 公开(公告)日: | 2018-08-28 |
| 发明(设计)人: | 刘鹏宇;李蕊;贾克斌 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 灰度共生矩阵 表情识别 人脸表情识别 彩色图像灰度 图像纹理特征 直方图均衡化 尺度归一化 表情图像 方法提取 分块处理 数据冗余 特征表达 特征向量 像素空间 统计量 低维 分块 分割 引入 保证 | ||
1.一种基于Gabor小波和灰度共生矩阵的人脸表情识别方法,其特征在于,
步骤如下:
步骤(1),采集样本
采集若干个人的N张局部遮挡的正面人脸表情静态图像,每张图像对应的表情类别即为该图像的样本标记,所有表情图像及其对应的样本标记构成实验样本;采用交叉验证中的10折交叉验证法,将实验样本划分成10等份,轮流将其中9份作为训练集X,剩余的1份作为测试集S,最后取10次实验结果正确率的平均值作为对算法识别准确率的估计;
步骤(2),样本预处理
处理对象是训练集X和测试集S内的所有表情图像,具体的预处理过程如下:
步骤(2.1),以双眼位置为基准获取人脸位置,并手工分割出“纯脸”区域;
步骤(2.2),采用加权平均法将彩色图像转换为灰度图像;
步骤(2.3),采用直方图均衡化方法降低光照变化对图像造成的影响;
步骤(2.4),对图像进行尺度归一化处理;
步骤(3),特征提取;
采用基于Gabor小波和灰度共生矩阵的特征提取算法分别对预处理后的X和S内的每幅图像进行表情特征提取,该算法过程分为三部分:低维Gabor特征统计量的提取、灰度共生矩阵特征的提取、高斯归一化;具体的过程描述如下:
步骤(3.1),低维Gabor特征统计量的提取
低维Gabor特征的提取是在传统Gabor特征提取的基础上,对Gabor滤波后生成的Gabor幅度图进行分块处理,再求取每个子块的特征统计量实现的,具体分为以下两个步骤:
步骤(3.1.1),传统Gabor特征的提取:将预处理后的训练集X和测试集S分别与二维Gabor小波函数作卷积,本方法选用5个尺度、8个方向,共40个Gabor滤波器与表情图像进行卷积,并且仅选用变换相对平稳的Gabor幅度信息作为有效信息,即每幅表情图像转化为40张GMPs,每幅GMPs对应的Gabor系数值即为所提取的Gabor特征;
步骤(3.1.2),分块的Gabor特征统计量的提取:利用传统算法提取图像Gabor特征时,一幅图像经过Gabor滤波后,其特征维数会扩大40倍,而且表情图像本身就属于高维数据,所以采用传统的Gabor特征提取方法可能会造成所谓的“维数灾难”,导致整个表情识别过程耗时较长;因此,本方法针对传统Gabor特征提取算法的不足,设计实现了一种分块的Gabor特征统计量的提取算法:
为了更有效表征人脸,依据面部主要器官的分布特性对人脸进行分块处理;具体的分块处理方法,是对每幅GMP在垂直方向按照图像高度进行上、中、下三等分,然后将最上面一部分按照图像宽度进行二等分,最终形成了4个子块:R0、R1、R2、R3,四个子块分别对应包含左眼、右眼、鼻子和嘴四类主要器官;
一幅表情图像经过传统的Gabor特征提取后生成40张GMPs,每张GMP经过分块处理被划分为4个子块,即一幅图像经过分块的Gabor特征提取后,会形成40×4=160个局部子块;对GMP图像进行分块处理,只是在提取的特征中加入了面部的空间信息,并没有从根本上降低Gabor特征的维数;所以继续对分块的Gabor特征进行处理:在统计工作中,均值和标准差是描述数据集中趋势和离散程度的两个最重要的统计量,能够反映出数据的本质特征;因此选用均值μu,v和标准差σu,v来统计每个GMP局部子块的数据,用于表示每个GMP的特征;两个统计量的计算公式如下:
式(1)、(2)中,GMu,v(x,y)是指第u个尺度、第v个方向下的GMP子块,m×n是指相应子块的大小;
最后将每幅GMP的每个子块提取的2维特征统计量串联在一起,形成一个40×4×2=320维的特征向量,即为所求的低维Gabor特征统计量;
步骤(3.2),灰度共生矩阵特征的提取;
步骤(3.2.1)求取灰度共生矩阵时,方向角θ选取0°、45°、90°和135°四个方向,距离分差值d=1,灰度级G从256级压缩至16级;
步骤(3.2.2),灰度共生矩阵无法直接进行特征表达,需要对其进行特征统计量的计算,选取对比度、差熵、能量和自相关4个特征统计量作为灰度共生矩阵的特征表达;
最后,求取4个特征统计量的均值和标准差作为纹理特征量,既一幅表情图像最终形成一个8维的灰度共生矩阵特征向量;
步骤(3.3),高斯归一化
将步骤(3.1)和步骤(3.2)中提取的图像特征进行线性组合,生成一组328维的低维特征向量;对该特征向量进行内部向量的高斯归一化处理,使各分量具有相同的权重,以提高图像判别的速度和成功率,即一幅表情图像最终由一组328维的特征向量进行表达;
步骤(4),样本分类
输入:通过以上步骤提取到的训练集X的表情特征集合X'及其对应的样本标记,以及提取到的测试集S的表情特征集合S'及其对应的样本标记;
输出:测试集S的人脸表情识别结果;
表情分类算法选用KNN分类算法,其核心思想是在训练集样本中找到测试样本的k个最邻近样本,然后根据这k个最邻近样本的类别来判定待测样本的类别;通过10折交叉验证法,取10次实验结果的平均值作为算法的表情识别率,最终完成局部遮挡条件下的人脸表情识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510370315.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种助力拉手结构及冰箱
- 下一篇:一种电驱动车辆用液压制动力调节装置





