[发明专利]一种图像分类方法、装置及电子设备在审
申请号: | 201810506379.1 | 申请日: | 2018-05-24 |
公开(公告)号: | CN108921190A | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 雷宇;董远;白洪亮;熊风烨 | 申请(专利权)人: | 北京飞搜科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 万铁占;张馨 |
地址: | 100876 北京市海淀区西土城路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像分类 装置及电子设备 图像分类模型 矩阵 神经网络 图像数据 通用的 混淆 申请 | ||
本申请公开了一种图像分类方法、装置及电子设备。所述方法包括:采用包含深度神经网络和混淆矩阵的图像分类模型,实现图像分类,该图像分类模型可以利用通用的图像数据训练得到。
技术领域
本申请涉及计算机软件技术领域,尤其涉及一种图像分类方法、装置及电子设备。
背景技术
目前,图像分类是计算机视觉的核心,实际应用广泛。图像分类的传统方法是特征描述及检测,这类传统方法可能对于一些简单的图像分类是有效的,但由于实际情况非常复杂,传统的分类方法不堪重负,所以许多研究者开始使用CNN等深度学习模型进行图像分类。
针对当下的图像分类任务,主要的深度学习方法就是确定一种输入图片尺寸然后在数据集上进行训练,这样虽然能够得到一个分类模型,但是这个分类模型对那些易于混淆的类别的识别效果并不好,并且识别出来的结果有可能和原本的类别差别较大。由于在类别数较大的情况下会有很多相似度高的类别,在训练过程中提取这些类的特征时会比较困难,从而影响到最后的分类效果,无法得到令人满意的结果。
发明内容
本说明书实施例提供了一种图像分类方法、装置及电子设备,用以解决一般图像分类方法分类效果不理想的问题,采用本申请实施例,可以明显提高图像分类的准确度。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供一种图像分类方法。包括:
图像数据被输入到利用通用图像数据训练的图像分类模型;
所述图像分类模型输出最大概率值对应的图像分类结果,其中所述图像分类模型包括深度神经网络和混淆矩阵。
本说明书实施例提供的一种图像分类装置。包括:输入模块、图像分类模型;
图像数据通过所述输入模块被输入到利用通用图像数据训练的图像分类模型;所述图像分类模型输出最大概率值对应的图像分类结果,其中所述图像分类模型包括深度神经网络和混淆矩阵。
本说明书实施例提供的一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
图像数据被输入到利用通用图像数据训练的图像分类模型;
所述图像分类模型输出最大概率值对应的图像分类结果,其中所述图像分类模型包括深度神经网络和混淆矩阵。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
(1)把所述混淆矩阵加入传统卷积神经网络图像分类中,有针对地进行训练、改进,以达到较高的图像分类准确率。
(2)适用性广,可以应用很多分类的场景中。
(3)不需要人工筛选,在代码中实现相应算法即可快速通过所述混淆矩阵对相似的类别进行合并。
(4)容易调整,只需更改相应的阈值即可控制最后合并的类别数。
(5)训练方法简单,可以利用现有的框架,方便调整网络结构和模型融合。
(6)相对正常的训练方式,有较好的性能提升。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京飞搜科技有限公司,未经北京飞搜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810506379.1/2.html,转载请声明来源钻瓜专利网。