[发明专利]一种面向主题的图像场景图生成方法在审

专利信息
申请号: 202110726055.0 申请日: 2021-06-29
公开(公告)号: CN113689514A 公开(公告)日: 2021-11-23
发明(设计)人: 张旻;陈景翔;姜明 申请(专利权)人: 杭州电子科技大学
主分类号: G06T11/00 分类号: G06T11/00;G06K9/00;G06K9/46;G06K9/62
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 朱月芬
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 主题 图像 场景 生成 方法
【权利要求书】:

1.一种面向主题的场景图生成方法,其特征在于包括以下步骤:

步骤(1)使用LDA概率主题模型,提取文本的主题概率分布以及主题的词汇分布,构建图像主题数据集;利用图像主题数据集,预训练图像主题预测模型;

步骤(2)结合图像主题,对图像进行目标检测,得到目标特征X和全局特征V,并融合全局特征V、目标特征X、类别特征Z以及主题特征T得到关系特征Y,对检测的目标(obj)预测其属性(attr)以及目标间的关系(rel),生成图像场景图;

步骤(3)对图像场景图生成模型进行训练,挑选最优训练模型;将图片输入训练好的图像场景图生成模型,输出对应的图像场景图;

步骤(4)使用显著性检测方法U-2-Net对图像进行显著性检测,并利用显著性检测的结果得到图像中各像素点的显著值,通过分析图像的显著值,得到图像的显著性区域;

步骤(5)结合显著性区域以及生成的图像场景图,根据定义规则,保留场景图中反映图像中心思想的目标以及关系,最终生成面向主题的图像场景图。

2.根据权利要求1所述的一种面向主题的场景图生成方法,其特征在于步骤(1)所述具体实现过程如下:

2-1使用MSCOCO数据集中的文本描述,利用LDA概率主题模型,提取所有描述的主题概率分布以及主题的词汇分布;假设文本中蕴含K个主题,文本描述的主题概率分布其中zi,k表示第i段文本描述关于第k个主题的概率;

2-2得到主题概率分布后,由于一张图像对应多段描述,等同于对应多个主题分布,因此将主题分布表示为同一张图像所有主题分布的平均值Φ,得到图像主题数据集,

其中,表示第i段文本描述的主题概率分布,N表示文本描述的数量;

2-3利用图像主题数据集,训练CNN网络来完成图像主题的预测,得到图像主题预测模型Topic Extractor;测试时图像作为输入,结果取主题概率最大的主题作为最终的图像主题。

3.根据权利要求2所述的一种面向主题的场景图生成方法,其特征在于步骤(2)具体实现如下:

3-1使用基于ResNet101预训练的Faster R-CNN目标检测模型对图像I进行目标检测,得到目标的一系列检测框B={bi|i=1,…,n},以及全局特征图V,如公式(1)所示;每个目标输入基于ResNet的网络中得到的目标特征X={xi|i=i,…,n},如公式(2)所示;

V,B=FasterRCNN(I)#(1)

X=ResNet(B)#(2)

3-2根据目标特征X预测出每个目标的类别特征Z={zi|i=1,..,n},zi∈Rd;其中,zi表示最终预测的类别,d表示预测类别的总数;如公式(3)所示;

其中,Wz是类别特征Z的特征权重;

3-3使用预训练的图像主题预测模型Topic Extractor对图像I进行主题抽取,得到主题特征T,如公式(4)所示;

T=TopicExtracor(I)#(4)

3-4融合四个分支的特征,包括全局特征V、目标特征X、类别特征Z以及主题特征T,共同预测关系类别Y,如公式(5)所示;采用两种通用的融合方式SUM和GATE,如公式(6)和公式(7)所示;

其中,x`e,v`e,z`e,t`e分别是目标特征,全局特征,类别特征和主题特征的嵌入向量,f是融合函数,Wr,Wx,Wv,Wt分别是xe,x`e,v`e,z`e,的特征权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110726055.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top