[发明专利]样本图像确定方法和装置、电子设备及存储介质有效
| 申请号: | 201811142162.3 | 申请日: | 2018-09-28 |
| 公开(公告)号: | CN109409414B | 公开(公告)日: | 2019-10-15 |
| 发明(设计)人: | 张志伟;王希爱;王树强 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 样本图像 方法和装置 存储介质 电子设备 概率向量 预测向量 人工手动 人力资源 分类器 预设 干预 预测 转化 | ||
本公开是关于一种样本图像确定方法和装置、电子设备及存储介质,其中所述方法包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。本公开提供的样本图像确定能够准确、快速的从多个样本图像中提取从困难样本图像,并且无需人工手动干预,能够节省人力资源。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种样本图像确定方法和装置、电子设备及存储介质。
背景技术
近来,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,使得视频图像分类任务在应用卷积神经网络之后,预测精度大幅提升。虽然目前图像分类模型对图像具有了一定的分类能力,但是仍然会有大量预测错误的样本图像,如何进一步优化图像分类模型成为一个需要解决的问题。
在训练图像分类模型时,困难样本图像的作用往往大于简单样本图像。在图像分类模型的学习过程中即便是大量的简单样本图像都很难对图像分类模型的预测精度带来大幅度提升,而困难样本图像往往会给图像分类模型的预测精度带来较大幅度的提升。
可见,目前迫切需要本领域技术人员解决的技术问题为,如何从大量样本图像中提取困难样本图像,从而通过困难样本图像对图像分类模型进行训练。
发明内容
为克服相关技术中存在的问题,本公开提供了一种样本图像确定方法和装置、电子设备及存储介质。
根据本公开实施例的第一方面,提供一种样本图像确定方法,包括:采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;分别将所述各样本图像对应的预测向量转化成概率向量;依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。
可选地,所述采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量,包括:针对每个样本图像,分别采用所述第一预设数量的分类器对各样本图像进行预测,得到所述第一预设数量个分类标签,其中,一个分类器对一个样本图像进行预测时生成一个分类标签;依据所述第一预设数量个分类标签,生成所述样本图像对应的预测向量。
可选地,所述分别将所述各样本图像对应的预测向量转化成概率向量,包括:针对每个样本图像,确定所述样本图像对应的预测向量中各分类标签出现的次数;针对所述预测向量中出现的每个分类标签,依据所述分类标签出现的次数和所述预测向量中的分类标签总个数,确定所述分类标签对应的概率值;依据所述预测向量中出现的所述各分类标签和所述各分类标签对应的概率值,生成所述预测向量对应的概率向量。
可选地,所述依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像,包括:分别计算各所述样本图像对应的概率向量的信息熵,其中,每个样本图像对应一个信息熵;依据所述各样本图像对应的信息熵,确定所述各样本图像中的困难样本图像。
可选地,所述依据所述各样本图像对应的信息熵,确定所述各样本图像中的困难样本,包括:将所述各样本图像对应的信息熵按照从大到小进行排序;将排序在前的第二预设数量个信息熵对应的样本图像确定为所述困难样本图像。
可选地,在所述采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量之前,所述方法还包括:随机初始化所述第一预设数量个分类器。
根据本公开实施例的第二方面,提供一种样本图像确定装置,包括:预测向量生成模块,被配置为采用第一预设数量的分类器分别对各样本图像进行预测,得到所述各样本图像对应的预测向量;转化模块,被配置为分别将所述各样本图像对应的预测向量转化成概率向量;确定模块,被配置为依据所述各样本图像对应的概率向量,从所述各样本图像中确定困难样本图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811142162.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:X射线乳腺肿块影像自动分类方法
- 下一篇:一种基于全局信息保持的LLE算法





