[发明专利]图像评价方法、设备、系统及存储介质有效
| 申请号: | 202310133423.X | 申请日: | 2023-02-20 |
| 公开(公告)号: | CN115830028B | 公开(公告)日: | 2023-05-23 |
| 发明(设计)人: | 王鹏飞;龙如蛟;杨志博;姚聪 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/0464 |
| 代理公司: | 北京同钧律师事务所 16037 | 代理人: | 吴梅锡;许怀远 |
| 地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 评价 方法 设备 系统 存储 介质 | ||
本申请提供一种图像评价方法、设备、系统及存储介质,通过获取包括至少一个子图的目标图像,通过特征提取模块获取目标图像的第一特征图,再将第一特征图输入特征融合模块,获取包含全局和局部信息的第二特征图。第一特征图通过子图检测模块,获取用于指示图像中子图中心位置的第三特征图,以及用于指示图像中子图角点位置的第四特征图。第二特征图通过子图质量属性预测模块,获取用于指示图像中子图的预设质量属性的信息。最后将第三特征图、第四特征图以及第五特征图输入多质量属性解码模块,以获得对目标图像中各子图的评价信息,评价信息包括子图的整体质量得分,以及多个质量属性得分或类别,实现对多子图的复杂图像的多属性质量评价。
技术领域
本申请涉及人工智能领域,尤其涉及一种图像评价方法、设备、系统及存储介质。
背景技术
图像质量评估是一种量化图像品质的方法,用来判定图像质量的高低,在图像压缩、视频编解码、视频监测等场景有着广泛的应用。根据原始参考图像的提供信息的多少,可以分为全参考、半参考和无参考图像质量评估方法。一般在实际应用中无法提供参考图像,因此无参考图像质量评估方法最有实用价值,也有着广泛的应用。同时,由于图像内容的千变万化并且无参考,也使得其成为热点研究对象。
基于深度学习技术的无参考图像质量评估,是目前的主流的评价方法,该方法通过对图像质量特征进行建模,可以获得图像质量评分,该评分通常是对图像整体质量的评分。
在一些场景中,例如卡证票据信息抽取场景,输入图像较为复杂,存在包含多个子区域的情况,例如图像中包括身份证正反面两个子区域。基于目前主流的评价方法是无法准确评价每个子区域的质量情况,且无法给出更细致的质量属性评价。
发明内容
本申请实施例提供一种图像评价方法、设备、系统及存储介质,实现对多子图的复杂图像的多属性质量评价。
本申请实施例的第一方面提供一种图像评价方法,该方法包括:
获取目标图像,目标图像中包括至少一个子图;
通过特征提取模块获取目标图像的第一特征图;
将第一特征图输入特征融合模块,获取第二特征图,第二特征图用于指示第一特征图的信息、目标图像的全局信息和局部信息;
将第一特征图输入子图检测模块,获取第三特征图,第三特征图用于指示目标图像中子图的位置信息;
将第二特征图输入子图质量属性预测模块,获取第四特征图和第五特征图,第四特征图用于指示目标图像的综合质量信息,第五特征图用于指示目标图像的预设质量属性的信息;
通过多质量属性解码模块对第三特征图、第四特征图和第五特征图进行解码,得到目标图像中至少一个子图的评价信息,评价信息包括子图的综合质量得分,以及预设质量属性的得分和/或类别。
一种可选的实施例中,特征融合模块包括全局信息提取模块、局部信息提取模块和短路链接模块;将第一特征图输入特征融合模块,获取第二特征图,包括:
将第一特征图分别输入到全局信息提取模块、局部信息提取模块和短路链接模块;
将全局信息提取模块、局部信息提取模块和短路链接模块的输出特征图沿着通道维度作拼接处理,获取第二特征图。
一种可选的实施例中,全局信息提取模块包括3层卷积神经网络层、1层池化层和1层扩展层,局部信息提取模块包括2层神经网络,短路链接模块用于透传第一特征图。
一种可选的实施例中,子图检测模块包括子图中心点检测模块和子图角点偏移量回归模块;将第一特征图输入子图检测模块,获取第三特征图,包括:
将第一特征图输入子图中心点检测模块,获取第六特征图,第六特征图用于指示目标图像中子图的中心点位置信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310133423.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





