[发明专利]一种基于视频输入的实时手语动作迁移方法及装置在审
申请号: | 202210558258.8 | 申请日: | 2022-05-21 |
公开(公告)号: | CN114937310A | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 熊蓉;张浩东;陈颖澔;吴禧洋;全泉 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/34;G06V10/44;G06V10/75;G06V10/82;G06N3/08 |
代理公司: | 杭州中成专利事务所有限公司 33212 | 代理人: | 李亦慈;唐银益 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视频 输入 实时 手语 动作 迁移 方法 装置 | ||
1.一种基于视频输入的实时手语动作迁移方法,其特征在于
获取RGB视频,通过人体位姿估计算法获得关节位置和姿态数据;
使用滤波、缩放、旋转、统一坐标系进行预处理得到关节数据;
获取关节数据通过编码器得到动作特征;
获取动作特征通过解码器得到机器人关节角数据;
获取关节角数据通过正运动学解算关节位置,并实时发送至机器人执行动作;
所述的编码器和解码器都是图神经网络。
2.如权利要求1所述的手语动作迁移方法,其特征在于,所述的人体位姿估计算法是从RGB视频中实时估计人体手臂和手指的关节位置和姿态数据。
3.如权利要求1所述的手语动作迁移方法,其特征在于,所述的图神经网络通过损失函数进行训练,损失函数用于鼓励机器人运动尽可能与人类的演示相似和平滑,并且不发生碰撞,并由六项组成:末端损失Lee、朝向损失Lori、肘部损失Lelb、手指损失Lfin、碰撞损失Lcol和平滑性损失Lsmo,其中λee、λori、λelb、λfin、λcol和λsmo是它们各自的权重;
L=λeeLee+λoriLori+λelbLelb+λfinLfin+λcolLcol+λsmoLsmo
末端损失Lee鼓励机器人与人类演示的末端位置相匹配,并比较归一化的末端位置的差异,使用均方误差,归一化系数是从肩部到手腕的长度,设pj和lj为末端j的位置和归一化系数,和为人类演示的相应变量,Lee被定义为:
朝向损失Lori是通过比较末端的朝向差异来计算的,同时也使用均方损失,设Rj和分别为机器人和人类的末端的旋转矩阵,Lori被定义为:
肘部损失Lelb鼓励其它关节的运动与人类演示相似,是通过比较从肘部到手腕的归一化向量来计算的,归一化系数是从肘部到腕部的长度,设和lwe为机器人手臂j的手腕位置、肘部位置和归一化系数,而和为人类演示的相应变量,Lelb的计算方法是:
手指损失Lfin鼓励机器人与人类的手指运动相匹配,手指动作是手语的一个重要组成部分,比较了从掌指关节到指尖的向量,通过手指长度归一化,设和ltm为指尖位置、掌指关节位置和机器人手指j的归一化系数,而和为人类演示的相应变量,Lfin的定义为:
碰撞损失Lcol是用来惩罚发生碰撞的机器人运动,将机器人每个关节建模为胶囊,并计算胶囊对之间的距离,若这个距离小于不发生碰撞的最小距离,则计算损失,设di,j为胶囊i和胶囊j之间的距离,dmin为无碰撞的阈值,Lcol被定义为:
平滑性损失Lsmo用于鼓励机器人生成连续平滑的动作,若rt为第t帧的机器人关节角,rt+1为第t+1帧的机器人关节角,如果相邻两帧的关节角相差很大就进行惩罚,那么Lsmo的定义为:
4.如权利要求1所述的手语动作迁移方法,其特征在于,所述的图神经网络训练完成后加载训练好的模型参数,直接通过前向传播输出机器人可执行的关节角,能够保证手语动作迁移的实时性,所述的图神经网络能够同时对双臂和双手进行实时动作迁移,并使用不同的网络权重参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210558258.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:液晶显示面板及液晶显示装置
- 下一篇:一种新型LED芯片封装结构及其制备方法