[发明专利]基于改进Transformer模型的手语视频生成方法在审

申请号：	202210821012.5	申请日：	2022-07-13
公开（公告）号：	CN115393948A	公开（公告）日：	2022-11-25
发明（设计）人：	崔振超;陈子昂;齐静	申请（专利权）人：	河北大学
主分类号：	G06V40/20	分类号：	G06V40/20;G06N3/04;G06N3/08
代理公司：	石家庄国域专利商标事务所有限公司 13112	代理人：	胡澎
地址：	071002 ***	国省代码：	河北;13
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于改进Transformer模型的手语视频生成方法以及装置。本发明中方法首先提取手语视频中的骨骼姿态序列，去除冗余信息以减少计算量。另外，考虑到时空信息对生成手语视频精度的重要性，设计富语义嵌入模块将位置和速度信息编码到相同的高维空间中作为模型的输入，提高关节运动的协调性，以提高特征表述的精确性。最后，构建呈金字塔结构的编码器‑解码器模型。编码器接受一个口语句子作为输入，并将序列中的信息编码为中间表示。然后解码器以半自回归的方式解码中间表示为目标手语姿态序列。通过本发明能够有效提高语义信息利用率和动作整体表达能力，由此明显提升手语视频生成的准确度和速度。
搜索关键词：	基于改进 transformer 模型手语视频生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河北大学，未经河北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210821012.5/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载