[发明专利]图像分类方法和装置、电子设备、可读存储介质在审
申请号: | 202010779364.X | 申请日: | 2020-08-05 |
公开(公告)号: | CN112016595A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 钱立辉;李马丁;王斌;于冰 | 申请(专利权)人: | 清华大学;北京达佳互联信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 方法 装置 电子设备 可读 存储 介质 | ||
本公开关于一种图像分类方法和装置、电子设备、可读存储介质。所述方法包括:获取初始待分类图像;获取所述初始待分类图像的深度热力图;所述深度热力图是指通过不同色域来表示初始待分类图像中对象的景深深度信息的图像;组合所述初始待分类图像的RGB通道图像与所述深度热力图,得到4通道的目标待分类图像;根据所述目标待分类图像,对所述初始待分类图像进行分类,以得到所述待分类图像是否为大光圈类型的图像。本实施例中通过增加包含景深深度信息的深度热力图作为待分类图像的一个维度特征,可以提升图像分类的准确度。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像分类方法和装置、电子设备、可读存储介质。
背景技术
目前,越来越多的用户喜欢使用单反等摄像机拍摄图像和视频,在拍摄过程中,拍摄者会采用景深(Depth of Field,DOF)效果,此时可以获得高清、美观,且具有一定立体视觉效果的大光圈图像或大光圈视频。
现实生活中,用户还可以将上述大光圈图像或大光圈视频上传到视频平台中分享,如快手。在用户上传视频后,现有视频平台可能会利用无参考视频质量评价(NR-VQA)算法,如目前比较流行的机器学习算法,来估算视频质量评分,从而将这类大光圈图像或者视频筛选出来,以作为后续视频推荐算法、视频超分辨率等应用的处理对象。
大光圈图像、视频的一个重要特征是在焦平面(即景深内),被拍摄的物体是清晰的,但是在焦平面前后,拍摄时入射光线会发生聚集和扩散,从而导致影像变得模糊,形成一个圆状的区域,常被称为“弥散圆”。然而,将上述机器学习算法应用到大光圈图像或者大光圈视频预测时,会由于“弥散圆”的存在,导致其无法准确的分辨出待预测对象是大光圈图像还是因压缩导致的失真图像,使得筛选结果有较高的错误率。
发明内容
本公开提供一种图像分类方法和装置、电子设备、可读存储介质,以至少解决相关技术中的问题。
本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种图像分类方法,包括:
获取初始待分类图像;
获取所述初始待分类图像的深度热力图;所述深度热力图是指通过不同色域来表示初始待分类图像中对象的景深深度信息的图像;
组合所述初始待分类图像的RGB通道图像与所述深度热力图,得到4通道的目标待分类图像;
根据所述目标待分类图像,对所述初始待分类图像进行分类,以得到所述待分类图像是否为大光圈类型的图像。
可选地,当待分类图像为待分类视频的视频帧序列中的一帧时,所述方法还包括:
基于所述视频帧序列中各初始待分类图像的预测分类获取表示所述待分类视频是否为大光圈类型的预测分类。
可选地,所述待分类视频的预测分类的取值为所述视频帧序列中各初始待分类图像的预测分类取值的平均值。
可选地,所述根据所述目标待分类图像,对所述初始待分类图像进行分类,以得到所述待分类图像是否为大光圈类型的图像,包括:
将所述目标分类图像输入到图像分类预测模型中,根据所述图像分类预测模型输出的预测分类信息,确定所述待分类图像是否为大光圈类型图像,其中所述图像分类预测模型是根据样本图像的深度热力图和所述样本图像的RGB通道图像训练得到的。
可选地,所述图像分类预测模型的输出层包括Sigmoid函数;所述Sigmoid函数用于输出取值连续的表示预测分类的数值,所述数值越接近于1表示初始待分类图像是大光圈类型的概率越大。
根据本公开实施例的第二方面,提供一种图像分类装置,所述装置包括:输入模块、获取模块和分类模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京达佳互联信息技术有限公司,未经清华大学;北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010779364.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于车辆的热管理系统和车辆
- 下一篇:一种脉诊仪工作端、诊脉装置和诊脉方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序