[发明专利]一种多标签分类模型训练方法、数据处理方法及装置有效
| 申请号: | 201910771659.X | 申请日: | 2019-08-20 |
| 公开(公告)号: | CN110458245B | 公开(公告)日: | 2021-11-02 |
| 发明(设计)人: | 张凌寒;陈权;郑敏鹏 | 申请(专利权)人: | 图谱未来(南京)人工智能研究院有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 安卫静 |
| 地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 标签 分类 模型 训练 方法 数据处理 装置 | ||
1.一种多标签分类模型训练方法,其特征在于,用于图像分类任务,所述方法包括:
利用i标签的样本数据对j标签分类模型进行训练,所述j标签分类模型包括j个独立的二元分类器,每个所述二元分类器对应有一个分类阈值,其中,i和j均为正整数且i小于j,所述标签为图像的分类标签;
获取每个所述二元分类器经训练得到的最优分类阈值,并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值;
基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注,得到k标签的样本数据,k为正整数,且k大于i小于等于j;
利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练,
其中,获取每个所述二元分类器经训练得到的最优分类阈值,包括:
获取每个所述二元分类器对所述i标签的样本数据的分类结果的概率分布,得到各自的表征分类结果为正类的第一概率曲线和表征分类结果为负类的第二概率曲线;
基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线,获取各自对应的所述最优分类阈值。
2.根据权利要求1所述的方法,其特征在于,基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线,获取各自对应的所述最优分类阈值,包括:
判断每个所述二元分类器各自对应的所述第一概率曲线与所述第二概率曲线是否交叉;
在为是时,确定所述第一概率曲线与所述第二概率曲线交叉处所对应的分类阈值为该二元分类器的所述最优分类阈值;
在为否时,确定位于所述第一概率曲线与所述第二概率曲线之间的分类阈值为该二元分类器的所述最优分类阈值。
3.根据权利要求1所述的方法,其特征在于,基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注,包括:
获取每个所述二元分类器对所述i标签的样本数据的分类结果;
对所述分类结果为正类的i标签的样本数据进行二次标注,使所述分类结果为正类的样本数据带有对应分类器的正向标签。
4.根据权利要求1-3任一项所述的方法,其特征在于,在利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练之后,所述方法还包括:
获取每个所述二元分类器经训练得到的最优分类阈值,并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值;
基于每个所述二元分类器对所述k标签的样本数据的分类结果对所述样本数据进行二次标注,得到j标签的样本数据;
利用所述j标签的样本数据对更新后的所述j标签分类模型进行训练,得到训练好的所述j标签分类模型。
5.一种数据处理方法,其特征在于,包括:
获取待分类的目标样本数据;
对所述目标样本数据进行特征提取,得到特征向量;
利用如权利要求1-4中任一项所述的方法训练得到的j标签分类模型对所述特征向量进行处理,得到分类结果。
6.一种多标签分类模型训练装置,其特征在于,用于图像分类任务,所述装置包括:
训练模块,用于利用i标签的样本数据对j标签分类模型进行训练,所述j标签分类模型包括j个独立的二元分类器,每个所述二元分类器对应有一个分类阈值,其中,i和j均为正整数且i小于j,所述标签为图像的分类标签;
获取模块,用于获取每个所述二元分类器经训练得到的最优分类阈值,并将每个所述二元分类器当前的分类阈值更新为对应的最优分类阈值;
标注模块,用于基于每个所述二元分类器对所述i标签的样本数据的分类结果对所述样本数据进行二次标注,得到k标签的样本数据,k为正整数,且k大于i小于等于j;
所述训练模块,还用于利用所述k标签的样本数据对更新后的所述j标签分类模型进行训练,
所述获取模块用于:
获取每个所述二元分类器对所述i标签的样本数据的分类结果的概率分布,得到各自的表征分类结果为正类的第一概率曲线和表征分类结果为负类的第二概率曲线;
基于每个所述二元分类器各自对应的所述第一概率曲线和所述第二概率曲线,获取各自对应的所述最优分类阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于图谱未来(南京)人工智能研究院有限公司,未经图谱未来(南京)人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910771659.X/1.html,转载请声明来源钻瓜专利网。





