[发明专利]手势识别方法、装置、计算机设备和存储介质在审
| 申请号: | 201911413447.0 | 申请日: | 2019-12-31 | 
| 公开(公告)号: | CN111126339A | 公开(公告)日: | 2020-05-08 | 
| 发明(设计)人: | 赵突 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 | 
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 | 
| 代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 张丽颖;刘蔓莉 | 
| 地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 手势 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种手势识别方法,其特征在于,所述方法包括:
获取包含至少一个手势特征的图像;
输入所述图像至已训练的关键点检测模型,得到各个所述手势特征的关键点的位置信息;
按照各个手势特征对应的关键点位置信息计算各个关键点之间的位置关系;
输入各个所述手势特征的关键点的位置信息和对应的位置关系至已训练的手势识别模型,输出各个所述手势特征对应的识别结果,其中所述已训练的手势识别模型和所述已训练的关键点检测模型为分别训练得到的模型。
2.根据权利要求1所述的方法,其特征在于,生成所述已训练的关键点检测模型,包括:
获取多个第一训练图像,所述第一训练图像携带标注信息,所述标注信息包括关键点的标准位置信息;
输入所述第一训练图像至关键点检测模型,输出各个关键点的预测位置信息;
根据各个所述关键点的预测位置信息与对应的标准位置信息之间的差异度,计算所述关键点检测模型的损失值,得到第一损失值;
当所述第一损失值位于第一预设损失值区间时,得到所述已训练的关键点检测模型。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述第一损失值不位于所述第一预设损失值区间时,根据所述第一损失值更新所述关键点检测模型的参数,得到中间关键点检测模型,执行输入所述第一训练图像至所述中间关键点检测模型,直至所述中间关键点检测模型的第一损失值位于所述第一预设损失值区间时,得到所述已训练的关键点检测模型。
4.根据权利要求1所述的方法,其特征在于,生成所述已训练的手势识别模型,包括:
获取多个第一标准手势和对应的关键点的位置信息;
根据各个所述第一标准手势对应的关键点的位置信息,计算各个所述第一标准手势的位置关系;
输入各个所述第一标准手势和对应的关键点的位置信息、位置关系至第一手势识别模型,输出各个所述第一标准手势对应的预测手势;
根据各个所述第一标准手势和对应的预测手势统计识别误差,根据所述识别误差计算所述第一手势识别模型的损失值,得到第二损失值;
当所述第二损失值位于第二预设损失值区间时,得到所述训练后的第一手势识别模型;
根据所述训练后的第一手势识别模型确定所述已训练的手势识别模型。
5.根据权利要求4所述的方法,其特征在于,所述方法还保括:
当所述第二损失值不位于所述第二预设损失值区间时,根据所述第二损失值更新所述第一手势识别模型的参数,得到中间手势识别模型,执行输入各个所述第一标准手势和对应的关键点的位置信息、位置关系至所述中间手势识别模型,直至所述中间手势识别模型的第二损失值位于第二预设损失值区间时,得到所述训练后的第一手势识别模型。
6.根据权利要求4或5所述的方法,其特征在于,所述训练后的第一手势识别模型包括输入层、隐藏层和输出层,所述输入层与所述隐藏层连接,所述隐藏层与所述输出层连接,所述输出层的输出的类别为第一数目,所述方法还包括:
获取待增加的类别数目,计算所述第一数目与待增加的类别数目的和,得到第二数目;
对所述已训练的第一手势识别模型的网络结构进行调整,得到第二手势识别模型,所述第二手势识别模型的输出层输出的类别数目为所述第二数目;
获取待增加的手势类别对应的分类训练数据,所述分类训练数据包括多个第二标准手势和对应的关键点的位置信息;
根据各个所述第二标准手势对应的关键点的位置信息,计算各个所述第二标准手势的位置关系;
将所述第一标准手势和所述第二标准手势组成的手势集合作为标准手势集合;
执行输入各个所述标准手势集合中的各个手势和对应的关键点的位置信息、位置关系至所述第二手势识别模型,直至所述第二手势识别模型的损失值位于第三预设损失区间时,得到训练后的第二手势识别模型;
所述根据所述训练后的第一手势识别模型确定所述已训练的手势识别模型,包括:将所述训练后的第一手势识别模型或所述训练后的第二手势识别模型作为所述已训练的手势识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911413447.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于背景学习的机场跑道FOD检测方法和系统
- 下一篇:牛仔布双层烘干辊





