[发明专利]用于图像描述模型的奖赏的确定方法及电子设备有效
申请号: | 201910340548.3 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110135472B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 陈添水;吴捷;梁小丹;林倞 | 申请(专利权)人: | 暗物智能科技(广州)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/58;G06Q30/02 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李红团 |
地址: | 511458 广东省广州市南沙区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 描述 模型 奖赏 确定 方法 电子设备 | ||
本发明涉及图像描述技术领域,具体涉及用于图像描述模型的奖赏的确定方法及电子设备,其中奖赏的确定方法包括:获取测试图像的标签描述以及预设图像描述模型基于所述测试图像的生成描述;基于所述测试图像及其生成描述,确定测试图像与所述生成描述的相关性;在训练集中提取所述测试图像的全局最相似图像;计算所述测试图像相对于所述全局最相似图像与所述生成描述的相关性差值,以确定第一全局奖赏;基于所述第一全局奖赏以及所述n元组的奖赏,更新所述生成描述中的每个单词的奖赏。通过计算得到的第一全局奖赏表示全局判别性的约束项,该约束项会使得测试图像与全局最相似图像之间的描述具有区分性与判别性,提高了图像描述的准确性。
技术领域
本发明涉及图像描述技术领域,具体涉及用于图像描述模型的奖赏的确定方法及电子设备。
背景技术
图像描述这一任务是日常生活中的常见任务。其目的是根据图像的内容生成一句描述图像内容的符合语法规则的自然语言描述。这一任务在现实生活中可以应用于儿童早教,导航引导等方面。
计算机视觉和自然语言处理的交叉领域是人工智能的两大领域,虽然这两个领域都有采用类似于的人工智能和机器学习的方法进行领域研究,但两个领域间的交互还很少。然而,近年来,自然语言处理和计算机视觉领域在分析和生成文本以及理解图像和视频方面取得了巨大的进步。图像描述作为计算机视觉和自然语言处理的交叉领域,近年来取得了显著的进展。
目前有很多方法模型被提出来解决图像描述的问题,然而现有的利用现有的方法模型所得到的生成描述的通常过于死板的句子,由一些最常见的单词/短语组成,从而导致不准确和难以区分的描述。
发明人通过研究发现,导致上述问题的原因在于,基本事实题注的单词分布不均匀,这鼓励了高频率的短语的生成,同时抑制了频率较低但更具体的短语。
发明内容
有鉴于此,本发明实施例提供了一种用于图像描述模型的奖赏的确定方法及电子设备,以解决图像描述的准确性偏低的问题。
根据第一方面,本发明实施例提供了一种用于图像描述模型的奖赏的确定方法,包括:
获取测试图像的标签描述以及预设图像描述模型基于所述测试图像的生成描述;
基于所述测试图像及其生成描述,确定测试图像与所述生成描述的相关性;
在训练集中提取所述测试图像的全局最相似图像;
计算所述测试图像相对于所述全局最相似图像与所述生成描述的相关性差值,以确定第一全局奖赏;
基于所述第一全局奖赏以及所述n元组的奖赏,更新所述生成描述中的每个单词的奖赏。
本发明实施例提供的用于图像描述模型的奖赏的确定方法,通过计算得到的第一全局奖赏表示全局判别性的约束项,该约束项会使得测试图像与全局最相似图像之间的描述具有区分性与判别性。该第一全局奖赏能够使得生成描述与相应的图像更加匹配,同时与其他相似图像的相关性减小,进一步提高了图像描述的准确性。
结合第一方面,在第一方面第二实施方式中,采用如下公式计算所述第一全局奖赏:
式中,[x]+=max(x,0);
其中,为所述第一全局奖赏;Ig为所述全局最相似图像;I为所述测试图像;为所述测试图像的生成描述;为所述全局最相似图像与所述生成描述的相关性;为所述测试图像与所述测试图像的生成描述的相关性;ε为常数。
结合第一方面,在第一方面第三实施方式中,所述基于所述第一全局奖赏以及所述奖赏待提升的单词的奖赏,更新所述生成描述中的每个单词的奖赏,还包括:
在所述训练集中提取预设数量的图像,以得到批量图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暗物智能科技(广州)有限公司,未经暗物智能科技(广州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910340548.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序