[发明专利]图像分割方法、训练图像分割模型的方法及装置在审
申请号: | 202310255078.7 | 申请日: | 2023-03-09 |
公开(公告)号: | CN116433899A | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 王晶;刘宇昂;周强;王志斌 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/22;G06V10/46;G06V10/77;G06V10/74;G06V10/762;G06V10/778 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 袁媛 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分割 方法 训练 模型 装置 | ||
本申请实施例公开了一种图像分割方法、训练图像分割模型的方法及装置。主要技术方案包括:获取待分割图像作为查询图像,以及获取查询图像的支持图像以及查询图像对应的目标描述文本;利用目标描述文本针对查询图像和支持图像分别生成第一伪掩码;对查询图像和支持图像分别进行编码处理,得到查询图像的第一特征表示和支持图像的第一特征表示;利用查询图像的第一伪掩码和支持图像的第一伪掩码,对查询图像的第一特征表示和支持图像的第一特征表示进行相关性匹配;利用相关性匹配的结果进行解码处理,得到对查询图像的分割结果,分割结果包括目标区域的位置信息。本申请能够提高小样本场景下图像分割的准确性。
技术领域
本申请涉及图像处理和人工智能技术领域,特别是涉及一种图像分割方法、训练图像分割模型的方法及装置。
背景技术
图像分割就是把图像分割成若干特定的、具有独特性质的区域并确定感兴趣的目标区域的技术和过程,是图像识别和计算机视觉至关重要的预处理。图像分割在医学领域、自动驾驶领域和卫星成像领域等方面有很多应用。
对于诸如遥感图像等包含多种目标、场景复杂、尺寸变化多的图像而言,获取大量的掩码标签是十分困难的。基于小样本学习得到的图像分割模型往往对这类图像的分割准确性较差,因此如何提高图像分割的准确性成为亟待解决的问题。
发明内容
有鉴于此,本申请提供了一种图像分割方法、训练图像分割模型的方法及装置,以便于提高小样本场景下图像分割的准确性。
本申请提供了如下方案:
第一方面,提供了一种图像分割方法,所述方法包括:
获取待分割图像作为查询图像,以及获取所述查询图像的支持图像以及查询图像对应的目标描述文本,其中所述支持图像与所述查询图像均包含所述目标描述文本所指示的目标;
利用所述目标描述文本针对所述查询图像和所述支持图像分别生成第一伪掩码,所述第一伪掩码为相应图像中目标区域被掩码后得到的;
对所述查询图像和所述支持图像分别进行编码处理,得到所述查询图像的第一特征表示和所述支持图像的第一特征表示;
利用所述查询图像的第一伪掩码和所述支持图像的第一伪掩码,对所述查询图像的第一特征表示和所述支持图像的第一特征表示进行相关性匹配;
利用所述相关性匹配的结果进行解码处理,得到对所述查询图像的分割结果,所述分割结果包括目标区域的位置信息。
根据本申请实施例中一可实现的方式,所述生成第一伪掩码包括:将所述查询图像和所述支持图像分别作为待掩码图像执行以下步骤:
将所述目标描述文本和待掩码图像输入掩码生成器,得到所述待掩码图像的第二伪掩码;
获取所述待掩码图像的第一特征表示;
利用所述第二伪掩码和所述待掩码图像的第一特征表示,获取所述待掩码图像的第一目标原型表示和第一背景原型表示;
利用所述待掩码图像的第一特征表示分别与所述第一目标原型表示、第一背景原型表示之间的相似度,得到所述待掩码图像的第一伪掩码。
根据本申请实施例中一可实现的方式,利用所述第二伪掩码和所述待掩码图像的第一特征表示,获取所述待掩码图像的第一目标原型表示包括:
利用所述查询图像的第二伪掩码和第一特征表示,得到所述查询图像的第二目标原型表示;以及利用所述支持图像的第二伪掩码和第一特征表示,得到所述支持图像的第二目标原型表示;
将所述查询图像的第二目标原型表示和所述支持图像的第二目标原型表示进行加权处理,将加权处理后得到的表示作为所述待掩码图像的第一目标原型表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310255078.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序