[发明专利]一种基于视频帧特征的快速手势识别方法有效
申请号: | 201910404105.6 | 申请日: | 2019-05-15 |
公开(公告)号: | CN110197138B | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 金波 | 申请(专利权)人: | 南京极目大数据技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06T5/00 |
代理公司: | 32360 南京泰普专利代理事务所(普通合伙) | 代理人: | 张磊 |
地址: | 211100 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手势识别 学习器 视频帧特征 集成学习 手势特征 滤波器 预处理 对视频数据 视频帧图像 输入视频帧 数据预处理 形态学变换 阈值化处理 分类结果 权重计算 色彩空间 手势分割 手势分类 数据映射 形状特征 语义空间 傅里叶 描述子 帧级别 权重 消减 加权 校正 手势 噪声 图像 赋予 | ||
本发明公开一种基于视频帧特征的快速手势识别方法,具体包括以下步骤:步骤1:视频帧图像数据预处理:对输入视频帧进行预处理,数据进行校正,并将数据映射到不同的语义空间;步骤2:标准手势分割:在特定色彩空间下进行阈值化处理,采用形态学变换和平滑滤波器来消减噪声,确定手势识别区域;步骤3:提取手势特征:提取手势区域的形状特征,包括Hu矩和傅里叶描述子等;步骤4,手势识别基于学习器选择及权重计算:选择两个不同的基学习器,不同的基学习器应当被赋予不同的权重;步骤5,集成学习将不同的手势分类的结果加权得到最终的分类结果。本发明通过对视频数据提取帧级别的图像,提取出典型的手势特征,并通过集成学习方法,实现较高精度的识别方法。
技术领域
本发明属于视频数据智能分析的技术领域,特别是涉及一种基于视频帧特征的快速手势识别方法。
背景技术
手势识别是一种计算机理解人体语言的方式,从而在机器和人之间建立了比文本用户界面或图形用户界面更丰富的桥梁。手势识别使人们能够与硬件设备进行通信,并且无需任何机械设备即可自然交互。手势由于直观、自然和以及易获取,已经成为人机交互的一个热点方向。
手势识别领域的研究者主要有:基于传感器数据的接触式和基于视觉的非接触式两钟。基于传感器数据的方法可以更准确地获取更多手势状态和特征,但穿戴设备会影响用户体验;基于视觉的方法能够使操作者以更加灵活和自然的方式进行人机交互,但有其局限性,不能高质量地保证手势特征的精度而影响识别精度。
发明内容
本发明为解决上述背景技术中存在的技术问题,设计一种快速和准确的手势识别方法。
本方案通过以下技术方案来实现:一种基于视频帧特征的快速手势识别方法,具体包括以下步骤:
步骤1:视频帧图像数据预处理:对输入视频帧进行预处理,数据进行校正,并将数据映射到不同的语义空间;
步骤2:标准手势分割:在特定色彩空间下进行阈值化处理,采用形态学变换和平滑滤波器来消减噪声,确定手势识别区域;
步骤3:提取手势特征:提取手势区域的形状特征,包括Hu矩和傅里叶描述子等;
步骤4,手势识别基于学习器选择及权重计算:选择两个不同的基学习器,不同的基学习器应当被赋予不同的权重;
步骤5,集成学习将不同的手势分类的结果加权得到最终的分类结果。
在进一步的实施例中,所述步骤1具体包括以下步骤:
步骤1-1,为了解决普遍光照情况下成像和显像的非线性,通过校正来进行补偿;
步骤1-2,通过高斯滤波和中值滤波来消减噪声,并加权处理:
在进一步的实施例中,所述步骤3具体包括以下步骤:
步骤3-1,形状特征融合特定手势的局部特征;
步骤3-2,步骤3-1,形状特征融合特定手势的局部特征;
步骤3-2,为了使得傅里叶描述子作为图像特征而具备尺度不变性,还需要对傅里叶描述子进行归一化处理。将得到的傅里叶描述子的每一项与第一个相除,即(FD(i))/(FD(1)),i=2,3,…,从而得到归一化的傅里叶描述子。
在进一步的实施例中,所述步骤4具体包括以下步骤:
步骤4-1,静态的选择基学习器数量;
步骤4-2,步骤4-1,静态的选择基学习器数量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京极目大数据技术有限公司,未经南京极目大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910404105.6/2.html,转载请声明来源钻瓜专利网。