[发明专利]基于关系三元组的人-物交互图像生成方法有效
| 申请号: | 202011086942.8 | 申请日: | 2020-10-12 |
| 公开(公告)号: | CN112233054B | 公开(公告)日: | 2022-09-16 |
| 发明(设计)人: | 刘偲;高晨;李波;王渌汀 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06T5/50 | 分类号: | G06T5/50;G06K9/62;G06N3/04;G06N3/08;G06V10/762;G06V10/80;G06V10/82 |
| 代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 符继超 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 关系 三元 交互 图像 生成 方法 | ||
1.一种基于关系三元组的人-物交互图像生成方法,其特征在于,包括:
根据给定动词修改原始图像中的人物姿态,得到人物图像;
根据预先获得的人-物交互信息,将所述人物图像与预先获得的物体图像进行融合,得到人-物交互图像,包括:
分别从所述人物图像和所述物体图像中提取各自的视觉特征,得到两组特征图;
构建双流网络结构,并使用对抗学习方式处理人物图像和物体图像;两个轻量级特征提取器会从视觉特征和fo中分别提取特征;两个RSTN网络分别应用于网络的两个输入流上;表示人物图像分支上的第一个RSTN,To,p(·)表示物体图像分支上的第二个RSTN;对两组特征图分别处理,并得到两个特征图和To,p(fo);
使用RSTN网络对两组特征图进行处理,将所述物体图像的特征图中含有语义信息的区域线性映射到所述人物图像的特征图中对应区域上;
将所述物体图像的特征图与所述人物图像的特征图沿通道方向进行拼接,并将拼接后的图像输入编码器-译码器中进行训练,得到人-物交互图像;
所述人-物交互图像的表达式为:
式中,表示人-物交互图像,表示编码器-译码器,表示人物图像的特征图,To,p(fo)表示物体图像的特征图;
RSTN模块的主要目标是高效生成图像的合理布局,解决图像间的不对齐问题,使用RSTN网络对两组特征图进行处理包括:
将物体类别嵌入映射到隐空间,得到n维隐编码e,并将给定动词嵌入映射到n维向量ηt;
通过条件增强模块计算n维向量c,得到隐编码[e,c];
根据所述隐编码[e,c]预测物体检测框在图像中的位置,并对位置坐标进行线性变换;
对位置坐标进行线性变换,所应用的公式为:
Aθ=Fθ(Fbbox([e,c])),
式中,Aθ表示线性变换矩阵,Fbbox(·)和Fθ(·)为两个映射函数,Fbbox(·)的功能是预测物体检测框在图像中的位置,Fθ(·)的功能是根据物体检测框的位置计算线性变换矩阵,[e,c]为隐编码,即用于预测RSTN线性变换矩阵的特征。
2.根据权利要求1所述的一种基于关系三元组的人-物交互图像生成方法,其特征在于,根据给定动词修改原始图像中的人物姿态,得到人物图像的过程,具体包括:
从原始图像中提取人物外貌信息;
根据给定动词,在预先构建的姿态模板库中选择一个目标姿态;
将所述目标姿态与所述人物外貌信息融合,合成人物图像。
3.根据权利要求2所述的一种基于关系三元组的人-物交互图像生成方法,其特征在于,从原始图像中提取人物外貌信息的过程具体包括:
对原始图像中人的身体关键点进行检测;
根据所述身体关键点获取人物姿态。
4.根据权利要求2所述的一种基于关系三元组的人-物交互图像生成方法,其特征在于,根据给定动词在预先构建的姿态模板库中选择一个目标姿态的过程,具体包括:
在预先构建的姿态模板库中选择一簇与给定动词一致的姿态;
在选出的一簇姿态中随机选择一个姿态作为目标姿态。
5.根据权利要求2所述的一种基于关系三元组的人-物交互图像生成方法,其特征在于,将所述目标姿态与所述人物外貌信息融合,合成人物图像的过程,具体包括:
将所述目标姿态与所述人物外貌信息中的人物姿态分别进行编码,得到编码结果;
将所述编码结果以及所述原始图像一并输入动词引导的人物图像生成器进行训练,生成人物图像。
6.根据权利要求1所述的一种基于关系三元组的人-物交互图像生成方法,还包括:判断所述人-物交互图像与期望的人-物交互关系是否一致,并优化所述人-物交互图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011086942.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:飞行器和飞行器的控制方法
- 下一篇:一种全系弦线齿轮及其齿轮组





