[发明专利]基于改进Transformer模型的手语视频生成方法在审
申请号: | 202210821012.5 | 申请日: | 2022-07-13 |
公开(公告)号: | CN115393948A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 崔振超;陈子昂;齐静 | 申请(专利权)人: | 河北大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06N3/04;G06N3/08 |
代理公司: | 石家庄国域专利商标事务所有限公司 13112 | 代理人: | 胡澎 |
地址: | 071002 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于改进Transformer模型的手语视频生成方法以及装置。本发明中方法首先提取手语视频中的骨骼姿态序列,去除冗余信息以减少计算量。另外,考虑到时空信息对生成手语视频精度的重要性,设计富语义嵌入模块将位置和速度信息编码到相同的高维空间中作为模型的输入,提高关节运动的协调性,以提高特征表述的精确性。最后,构建呈金字塔结构的编码器‑解码器模型。编码器接受一个口语句子作为输入,并将序列中的信息编码为中间表示。然后解码器以半自回归的方式解码中间表示为目标手语姿态序列。通过本发明能够有效提高语义信息利用率和动作整体表达能力,由此明显提升手语视频生成的准确度和速度。 | ||
搜索关键词: | 基于 改进 transformer 模型 手语 视频 生成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北大学,未经河北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210821012.5/,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法