[发明专利]训练分类器的方法、装置、电子设备和计算机可读存储介质在审
申请号: | 201910453997.9 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110210553A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 王诗吟 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 陈龙 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练分类器 目标对象 分类器 图像集合 子集合 集合 计算机可读存储介质 标签信息 电子设备 输出项目 输入图像 获取图像 训练过程 | ||
本公开公开了一种训练分类器的方法,其特征在于,包括:获取图像集合,所述图像集合包括第一子集合,第二子集合,和第三子集合,各子集合分别对应标签信息;确定分类器的输出项目,所述分类器的输出项目分别于所述标签信息对应;根据所述图像集合训练所述分类器。本公开实施例提供的训练分类器的方法、装置、电子设备和计算机可读存储介质,在训练分类器的过程中所采用的图像集合中包括不同类别的目标对象的集合以及不包括所述目标对象的集合,从而可以通过一个分类器实现对输入图像中是否包括所述目标对象的判断以及对输入图像中所包括的所述目标对象的类别的判断,简化了训练过程。
技术领域
本公开涉及信息处理领域,尤其涉及一种训练分类器的方法、装置、电子设备及计算机可读存储介质。
背景技术
随着计算机技术的进步,与图像相关的应用愈发丰富,例如基于卷积神经网络的分类器能够用于对输入图像的识别和/或分类。
需要通过训练集合训练基于卷积神经网络的分类器(也称作卷积神经网络分类器),才能将分类器用于对输入的图像进行识别和/或分类。以识别输入的图像中是否包括人物对象为例,需要以大量的包括人物对象的图像和不包括人物对象的图像作为训练集合来训练分类器,一个典型的训练分类器的过程包括对训练集合中的图像进行卷积层的计算、非线性层的计算、和/或池化层的计算,然后经过完全连接层计算出分类结果(例如分类为包括人物对象的图像和不包括人物对象的图像),可以认为上述卷积层、非线性层、池化层、以及完全连接层构成了卷积神经网络的框架。对于完全连接层计算出的分类结果,还需要将其与图像本身是否包括人物对象的标签信息进行比对以构造损失函数,在通过梯度下降等算法根据该损失函数更新训练过程中涉及的权重和偏置等参数之后,再根据更新后的参数重新计算分类结果,如此迭代,当计算出最优的分类结果则意味着分类器训练完成,从而通过该分类器可以对输入的图像进行识别和/或分类,例如对于输入的图像,该分类器可以给出该输入图像中包括人物对象或者不包括人物对象的分类结果。同理,还可以通过训练集合训练用于对图像中的目标对象进行分类的分类器,例如以大量的包括人物对象的图像作为训练集合来训练分类器以分类和/或识别出男人或女人等。
如上所述,如果希望通过分类器对输入图像中的目标对象进行分类,在不确定该输入图像中是否包括目标对象的情况下,需要先训练一个分类器用于判断输入图像中是否包括目标对象,如果确定输入图像包括目标对象,则再训练另一个分类器用于判断该目标对象的类别,因此一共需要训练两个分类器,训练过程非常繁琐。
发明内容
本公开实施例提供训练分类器的方法,装置,电子设备,和计算机可读存储介质,在训练分类器的过程中所采用的图像集合中包括不同类别的目标对象的集合以及不包括所述目标对象的集合,从而可以通过一个分类器实现对输入图像中是否包括所述目标对象的判断以及对输入图像中所包括的所述目标对象的类别的判断,简化了训练过程。
第一方面,本公开实施例提供一种训练分类器的方法,其特征在于,包括:获取图像集合,所述图像集合包括第一子集合,第二子集合,和第三子集合,所述第一子集合中的图像与第一标签信息对应,所述第二子集合中的图像与第二标签信息对应,所述第三子集合中的图像与第三标签信息对应,其中,所述第一标签信息指示与所述第一标签信息对应的图像中包括第一类别的目标对象,所述第二标签信息指示与所述第二标签信息对应的图像中包括第二类别的所述目标对象,所述第三标签信息指示与所述第三标签信息对应的图像中不包括所述目标对象;确定分类器的输出项目,所述输出项目包括第一项目,第二项目,和第三项目,所述第一标签信息与所述第一项目对应,所述第二标签信息与所述第二项目对应,所述第三标签信息与所述第三项目对应;根据所述图像集合训练所述分类器。
进一步的,根据所述图像集合训练所述分类器,包括:根据柔性最大值损失函数(softmax loss function)和中心损失函数(center loss function)确定所述分类器的损失函数;根据所述图像集合和所述分类器的损失函数训练所述分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910453997.9/2.html,转载请声明来源钻瓜专利网。