[发明专利]一种基于隐马尔科夫模型自增量学习的动态手势识别方法有效
申请号: | 201310585572.6 | 申请日: | 2013-11-19 |
公开(公告)号: | CN103593680A | 公开(公告)日: | 2014-02-19 |
发明(设计)人: | 申富饶;胡孟;赵金熙 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐马尔科夫 模型 增量 学习 动态 手势 识别 方法 | ||
1.一种基于隐马尔科夫模型自增量学习的动态手势识别方法,其特征在于,包括以下步骤:
(1)手势检测与跟踪;
(2)特征提取与矢量量化;
(3)模型训练与手势识别;
(4)增量学习。
2.根据权利要求1所述的一种基于隐马尔科夫模型自增量学习的动态手势识别方法,其特征在于,手势检测与跟踪包括以下步骤:
S1:通过摄像头或已存在的视频文件获取包含手势的视频流;
S2:对视频流中的每一个图像帧P0作如下处理以检测与跟踪图像帧中的手势:
S2.1:调整每一个图像帧P0大小至统一尺寸,并对图像帧P0进行中值滤波,得到图像帧P1;
S2.2:将滤波后的图像帧P1从RGB色彩空间转换至YCrCb色彩空间,其中R、G、B分别表示红、绿、蓝三个通道;Y表示亮度分量,Cb指蓝色色度分量,Cr指红色色度分量;
S2.3:分离Cr、Cb通道图像,根据阈值二值化Cr、Cb通道图像,阈值为133≤Cr≤173,77≤Cb≤127;
S2.4:将Cr、Cb通道的二值图像并集求和,得到二值图像帧P2;
S2.5:对二值图像帧P2做腐蚀、膨胀操作,得到二值图像帧P3;
S2.6:去除二值图像帧P3中小于面积阈值的区域,面积阈值为二值图像帧P3面积的5%,将剩余的区域组成二值图像帧P4;
S2.7:在步骤S2.1得到的图像帧P1中框选出对应二值图像帧P4的矩形区域,框选的矩形区域内为图像帧P1中原始RGB色彩空间的图像,区域外的图像赋值为纯黑色,得到图像帧P5;
S2.8:将步骤S2.7得到的图像帧P5通过灰度变换转为单通道灰度图像,再将灰度图像直方图均衡化,灰度图像为单一通道,得到图像帧P6;
S2.9:将步骤S2.8中得到的图像帧P6通过adaboost算法分类器检测并标定人体头部区域;
S2.10:在步骤S2.7的图像帧P5去除中步骤S2.9中检测到的人体头部区域,得到图像帧P7,图像帧P7中除处于阈值133≤Cr≤173和77≤Cb≤127的区域外,其余区域为纯黑色;
S2.11:将步骤S2.10的图像帧P7从RGB色彩空间转换至HSV色彩空间,并分离出H空间,得到图像帧P8;
S2.12:计算步骤S2.11分离出的H空间的图像帧的直方图方向投影;
S2.13:根据步骤S2.13的结果计算直方图反向投影,结合Camshift跟踪算法,跟踪动态的手势,选出手部区域,得到图像帧P9;
S2.14:提取图像帧P9中手部区域中心点的坐标。
3.根据权利要求2所述的一种基于隐马尔科夫模型自增量学习的动态手势识别方法,其特征在于,步骤S2.6中,区域面积计算采用连通像素点求和的统计方法,使用队列的数据结构逐点统计图像帧中的每一个点,去除小于面积阈值的区域,并同时计算检测到的剩余的区域的顶、底、左、右四个边界的坐标和区域面积。
4.根据权利要求2所述的一种基于隐马尔科夫模型自增量学习的动态手势识别方法,其特征在于,特征提取与矢量量化包括以下步骤:
S3:根据步骤S2.1~S2.14得到视频流中的每一幅图像帧的手部区域中心点的坐标,将视频流所有图像帧中手部区域中心点的坐标组成手部运动轨迹的时间序列,该时间序列即为捕获到的手势运动轨迹的特征向量;
S4:将S3中的特征向量序列矢量量化,得到一个整型符号序列,该整型符号序列即模型训练与手势识别采用的手势动作序列输入样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310585572.6/1.html,转载请声明来源钻瓜专利网。