[发明专利]一种手势识别方法在审
申请号: | 202011485807.0 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112507918A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 钟浩;伍广彬;言宏亮;曹晟;于波;张华;杨波;梁兴伟;杨卫国 | 申请(专利权)人: | 康佳集团股份有限公司;深圳市格灵人工智能与机器人研究院有限公司;哈尔滨工业大学(深圳);深圳哈工大科技创新产业发展有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 陈专 |
地址: | 518057 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手势 识别 方法 | ||
本发明公开了一种手势识别方法,方法包括:获取视频文件中的第t帧图像;将第t帧图像输入已训练的手势识别模型,并控制手势识别模型对第t帧图像进行手势识别,得到第t帧图像对应的图像手势;当图像手势为静态手势类型时,将图像手势作为目标手势;当图像手势为动态手势类型时,迭代获取视频文件中的帧图像,并根据帧图像对应的图像手势,确定视频文件对应的目标手势;根据目标手势,确定视频文件对应的手势指令。本发明通过对手势模型的优化以及动态手势类型和静态手势类型识别的结合,提高在对手势识别精确度。
技术领域
本发明涉及生物识别技术领域,尤其涉及一种手势识别方法。
背景技术
随着计算机视觉技术的快速发展,人机交互在各个领域应用也越来越广泛。手势是一种直观、自然且快速地与计算机进行通信的交互技术。因此,手势识别技术也是目前人机交互技术中研究的重点方向之一。目前,手势识别技术已普遍应用于各种智能终端中,通过手势控制终端完成相应的功能操作,可实现对智能终端自然灵活的操作,增强操作的简便性及用户的体验度。然而,手势识别技术也依然存在一定的瓶颈,如何在基于大分辨图像下并且处于复杂的环境背景中快速准确的识别手势,以让智能终端实时响应完成相应的功能,这也是目前手势识别技术研究的一个热点问题和难点问题。
目前应用于手势识别的方式主要有三种,第一种是采用机器学习方法,利用传统图像处理方法对摄取图像进行预处理,然后对手势进行分割以及定位,最后设计分类器对手势进行分类,分类出相应的手势;第二种是采用深度学习方法,先通过CNN(Convolutional Neural Networks,简称CNN)网络回归定位出人,然后在检测到人的基础上再设计一个CNN网络对手势进行定位与分类,从而确定手势类型;第三种同样也是利用深度学习思想设计CNN网络直接检测出手部骨骼的关键点,然后利用关键点位置关系,进而可以判别每个手势的类别。
对于方法一,在复杂场景或者大分辨图像背景下,虽然这种方法速度快,但是鲁棒性差,准确率低,难以满足实际应用;对于方法二,通过设计CNN网络先定位人,在对手势进行定位与分类识别,此种方法对于大分辨图像以及复杂场景下,能保证较高的识别精度,稳定性高,但是这种方法往往在嵌入式设备上速度往往较慢,硬件内存消耗大,不利于量产使用。而对于方法三,在大分辨率图像下,由于手部占整个图像的比例比较小,往往会导致漏检,从而导致整个识别的精度不高,另外,在复杂场景下,这种方法也会把一些背景纳入手势识别的范围,从而导致手势误检。
发明内容
本发明的主要目的在于提供一种手势识别方法、智能终端及计算机可读存储介质,旨在解决现有技术中手势识别准确率低的问题。
为实现上述目的,本发明提供一种手势识别方法,所述手势识别方法包括如下步骤:
获取视频文件中的第t帧图像,其中,t为正整数;
将所述第t帧图像输入已训练的手势识别模型,并控制所述手势识别模型对所述第t帧图像进行手势识别,得到所述第t帧图像对应的图像手势;
当所述图像手势为静态手势类型时,将所述图像手势作为目标手势;
当所述图像手势为动态手势类型时,迭代获取所述视频文件中的帧图像,并根据所述帧图像对应的图像手势,确定所述视频文件对应的目标手势;
根据所述目标手势,确定所述视频文件对应的手势指令。
可选地,所述的手势识别方法,其中,所述手势识别模型包括基于预设的神经网络训练得到的模型,所述神经网络的主干网络为轻量级神经网络;所述轻量级神经网络包括网络扩张系数为小于六倍的MobileNet2网络。
可选地,所述的手势识别方法,其中,所述手势识别模型的训练过程包括:
获取训练样本集,并对所述训练样本集进行标注,得到所述训练样本集中各个训练图像对应的标注信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康佳集团股份有限公司;深圳市格灵人工智能与机器人研究院有限公司;哈尔滨工业大学(深圳);深圳哈工大科技创新产业发展有限公司,未经康佳集团股份有限公司;深圳市格灵人工智能与机器人研究院有限公司;哈尔滨工业大学(深圳);深圳哈工大科技创新产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011485807.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电容点焊加工的翻转机构
- 下一篇:加载结构件形变测量装置及测量方法