[发明专利]基于OpenPose的单目相机手语识别方法有效

申请号：	201810151624.1	申请日：	2018-02-13
公开（公告）号：	CN108537109B	公开（公告）日：	2021-07-09
发明（设计）人：	薛启凡;李煊鹏	申请（专利权）人：	东南大学
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	柏尚春
地址：	211189 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 openpose 相机手语识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于OpenPose的单目相机手语识别方法，其特征在于，包括以下步骤：

(1)用摄像机采集演示者手语的视频数据；

(2)将采集的视频数据输入到OpenPose系统中，初步提取包括x轴坐标和y轴坐标以及置信度的三维特征数据；

(3)选取初步提取的特征点，以颈部为原点重新建立坐标系，并且在x轴方向和y轴方向进行归一化，得到最终特征数据；

(4)对步骤(3)得到的特征数据用不同粒度进行扫描，得到维度更大扩展特征数据；

(5)将步骤(4)得到的扩展特征数据输入到深度森林模型内进行多层语义识别，最后一层的输出通过极值分类器得到最终语义的识别结果。

2.根据权利要求1所述的基于OpenPose的单目相机手语识别方法，其特征在于，所述步骤(1)中摄像机为单目摄像机。

3.根据权利要求1所述的基于OpenPose的单目相机手语识别方法，其特征在于，所述步骤(2)中读取OpenPose输出的特征点json文件，将文件中每一帧的x，y坐标按顺序写入特征数量矩阵，对于置信度高于0.6的特征点，读取每个特征点的x坐标与y坐标，对于置信度低于0.6的特征点，对相邻特征点做均值插值进行预测，得到的特征数量矩阵数据即为初步提取的特征数据，数据格式为json，一帧图片提取60个特征点，一个动作共60*n个特征点，其中n语义动作的帧数。

4.根据权利要求3所述的基于OpenPose的单目相机手语识别方法，其特征在于，所述步骤(3)选取其44个特征点，以颈部为原点重新建立坐标系，并且在x轴方向和y轴方向进行归一化，得到n*44*2的最终特征数据。

5.根据权利要求1所述的基于OpenPose的单目相机手语识别方法，其特征在于，所述步骤(4)中采用三种不同的粒度进行扫描。

6.根据权利要求1所述的基于OpenPose的单目相机手语识别方法，其特征在于，所述步骤(5)中深度森林模型由若干层组成，每一层有两个随机森林和两个完全随机森林，第一层的输入为步骤(4)中的扩展特征，第一层的输出级与原始的扩展特征同时作为第二层的输入，每一层都以上一层的输出级与原始扩展特征同时作为输入。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810151624.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种东亚飞蝗龄期识别方法及装置
下一篇：生成三维人脸模型的基于虚拟现实的装置和方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于OpenPose的单目相机手语识别方法有效

专利文献下载