[发明专利]图像识别方法、装置及计算机可读存储介质有效
申请号: | 201711318139.0 | 申请日: | 2017-12-12 |
公开(公告)号: | CN107992894B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 张水发 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/764;G06V10/84 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 林锦澜 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种图像识别方法,其特征在于,所述方法包括:
获取待识别的第一图像的分辨率;
当所述第一图像的分辨率大于第一预设分辨率时,将所述第一图像缩放为具有所述第一预设分辨率的第二图像;当所述第一图像的分辨率小于第二预设分辨率时,将所述第一图像缩放为具有所述第二预设分辨率的第二图像;通过指定多尺度层中包含的卷积层或反卷积层生成所述第二图像对应的具有第三预设分辨率的第三图像,所述第三预设分辨率为指定分类器能够对图像进行准确识别的分辨率,所述第一预设分辨率是所述第三预设分辨率的N倍,所述第三预设分辨率是所述第二预设分辨率的N倍,所述N大于1;
当所述第一图像的分辨率小于或等于所述第一预设分辨率且大于或等于所述第二预设分辨率时,将所述第一图像缩放为具有所述第三预设分辨率的第三图像;
通过指定分类器对所述第三图像进行识别,其中,所述指定分类器和所述指定多尺度层是通过对待训练的多尺度层和分类模型同时进行训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述通过指定多尺度层中包含的卷积层或反卷积层生成所述第二图像对应的具有第三预设分辨率的第三图像,包括:
当所述第二图像的分辨率为所述第一预设分辨率时,通过所述指定多尺度层中包含的卷积层生成所述第二图像对应的具有所述第三预设分辨率的第三图像;
当所述第二图像的分辨率为所述第二预设分辨率时,通过所述指定多尺度层中包含的反卷积层生成所述第二图像对应的具有所述第三预设分辨率的第三图像。
3.根据权利要求1-2任一所述的方法,其特征在于,所述方法还包括:
获取多个预设图像集,所述多个预设图像集中每个预设图像集包括的所有的预设图像属于同一类别;
使用所述多个预设图像集对待训练的多尺度层和分类模型进行训练,得到所述指定多尺度层和所述指定分类器。
4.一种图像识别装置,其特征在于,所述装置包括:
第一获取模块,用于获取待识别的第一图像的分辨率;
生成模块,用于当所述第一图像的分辨率大于第一预设分辨率时,将所述第一图像缩放为具有所述第一预设分辨率的第二图像;当所述第一图像的分辨率小于第二预设分辨率时,将所述第一图像缩放为具有所述第二预设分辨率的第二图像;通过指定多尺度层中包含的卷积层或反卷积层生成所述第二图像对应的具有第三预设分辨率的第三图像,所述第三预设分辨率为指定分类器能够对图像进行准确识别的分辨率,所述第一预设分辨率是所述第三预设分辨率的N倍,所述第三预设分辨率是所述第二预设分辨率的N倍,所述N大于1;
缩放模块,用于当所述第一图像的分辨率小于或等于所述第一预设分辨率且大于或等于所述第二预设分辨率时,将所述第一图像缩放为具有所述第三预设分辨率的第三图像;
识别模块,用于通过指定分类器对所述第三图像进行识别,其中,所述指定分类器和所述指定多尺度层是通过对待训练的多尺度层和分类模型同时进行训练得到的。
5.根据权利要求4所述的装置,其特征在于,所述生成模块包括:生成子模块;
所述生成子模块用于:
当所述第二图像的分辨率为所述第一预设分辨率时,通过所述指定多尺度层中包含的卷积层生成所述第二图像对应的具有所述第三预设分辨率的第三图像;
当所述第二图像的分辨率为所述第二预设分辨率时,通过所述指定多尺度层中包含的反卷积层生成所述第二图像对应的具有所述第三预设分辨率的第三图像。
6.根据权利要求4-5任一所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取多个预设图像集,所述多个预设图像集中每个预设图像集包括的所有的预设图像属于同一类别;
训练模块,用于使用所述多个预设图像集对待训练的多尺度层和分类模型进行训练,得到所述指定多尺度层和所述指定分类器。
7.一种图像识别装置,其特征在于,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-3所述的任一项方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,所述指令被处理器执行时实现权利要求1-3所述的任一项方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711318139.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于自动转换开关中的摇臂
- 下一篇:一种操动开关压配座
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序