[发明专利]图像识别方法、训练图像识别模型的方法及对应装置在审
申请号: | 202310187135.2 | 申请日: | 2023-02-24 |
公开(公告)号: | CN116206309A | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 陈昊星;顾章轩;兰钧;孟昌华;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06V20/70 | 分类号: | G06V20/70;G06V10/774;G06V10/764;G06V10/74;G06V10/40 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 训练 模型 对应 装置 | ||
本说明书实施例提供了一种图像识别方法、训练图像识别模型的方法及对应装置。主要技术方案包括:获取待识别图像;利用图像识别模型确定所述待识别图像对应的图像类别;其中,所述图像识别模型提取所述待识别图像的视觉特征表示;利用所述待识别图像的视觉特征表示与属性词库中各属性词的特征表示进行匹配,得到所述待识别图像的融合特征表示,该融合特征表示包括所述待识别图像在各属性词上的置信度分布;利用所述待识别图像的融合特征表示预测所述待识别图像对应的图像类别。本申请能够提高图像识别在细粒度图像类别上的识别准确性。
技术领域
本说明书一个或多个实施例涉及图像处理技术领域,尤其涉及一种图像识别方法、训练图像识别模型的方法及对应装置。
背景技术
随着图像处理技术的飞速发展,推动了图像识别技术的产生并逐渐成为人工智能领域中重要的组成部分。所谓图像识别是指利用计算机对图像进行处理和分析,以识别图像中包含的目标类型的技术。目前图像识别已经被广泛应用到各个领域中,例如安全领域中的人脸识别、风控领域中的风险人物识别、交通领域中的交通标识识别、自动驾驶领域中的障碍物识别等等。
目前业界越来越多的提出使用深度学习方法进行图像识别,但目前基于深度学习方法进行的图像识别对于细粒度的图像类别难以区分,从而造成识别准确性较差。
发明内容
有鉴于此,本说明书一个或多个实施例公开了一种图像识别方法、训练图像识别模型的方法及装置,用以提高图像识别在细粒度图像类别上的识别准确性。
根据第一方面,本公开提供了一种图像识别方法,所述方法包括:
获取待识别图像;
利用图像识别模型确定所述待识别图像对应的图像类别;其中,所述图像识别模型提取所述待识别图像的视觉特征表示;利用所述待识别图像的视觉特征表示与属性词库中各属性词的特征表示进行匹配,得到所述待识别图像的融合特征表示,该融合特征表示包括所述待识别图像在各属性词上的置信度分布;利用所述待识别图像的融合特征表示预测所述待识别图像对应的图像类别。
根据本申请实施例中一可实现的方式,利用所述待识别图像的融合特征表示预测所述待识别图像对应的图像类别包括:
利用所述待识别图像的融合特征表示与各图像类别的属性原型之间的距离,得到所述待识别图像对应的图像类别;
其中所述图像类别的属性原型是利用该图像类别的支持图像的融合特征表示得到的。
根据本申请实施例中一可实现的方式,所述方法还包括:针对各图像类别分别执行:
获取该图像类别的支持图像;
针对各支持图像,分别提取支持图像的视觉特征表示,并利用该支持图像的视觉特征表示与属性词库中各属性词的特征表示进行匹配,得到该支持图像的融合特征表示,该融合特征表示包括所述支持图像在各属性词上的置信度分布;
利用该图像类别的各支持图像对应的融合特征表示,得到该图像类别的融合特征表示作为该图像类别的属性原型。
根据本申请实施例中一可实现的方式,所述待识别图像的视觉特征表示包括所述待识别图像中各图块的视觉特征表示;
利用所述待识别图像的视觉特征表示与属性词库中各属性词的特征表示进行匹配包括:
分别计算各图块的视觉特征表示与属性词库中各属性词的特征表示之间的相似度,得到各属性词对应的相似度向量;
分别针对各属性词执行:将属性词对应的相似度向量与所述待识别图像的视觉特征表示进行交叉注意力处理,得到该属性词的视觉表示;利用该属性词的特征表示和视觉表示,得到所述待识别图像在该属性词上的置信度;
利用所述待识别图像在各属性词上的置信度,得到所述待识别图像的融合特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310187135.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序