[发明专利]一种适用于样本分布不均衡的多标签多分类方法有效
| 申请号: | 202010166042.8 | 申请日: | 2020-03-11 |
| 公开(公告)号: | CN111382800B | 公开(公告)日: | 2022-11-25 |
| 发明(设计)人: | 马祥祥 | 申请(专利权)人: | 上海爱数信息技术股份有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/04;G06F16/55 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
| 地址: | 201112 上海市闵行*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 适用于 样本 分布 均衡 标签 分类 方法 | ||
本发明涉及一种适用于样本分布不均衡的多标签多分类方法,包括以下步骤:S1:构建并训练一个基于神经网络的多标签多分类模型,并设定比较对象;S2:利用训练完成的多标签多分类模型和训练样本,计算各个标签上,所有训练样本对应比较对象的平均值,作为比较平均值;S3:将待检测图片输入多标签多分类模型,得到在各标签上,该图片对应比较对象的值,作为比较值;S4:选取该图片比较值与比较平均值最接近的前N个标签,作为待检测图片的标签,完成对图片的多标签多分类,与现有技术相比,本发明具有实现简单、容易训练且适用性广等优点。
技术领域
本发明涉及深度学习的多标签多分类领域,尤其是涉及一种适用于样本分布不均衡的多标签多分类方法。
背景技术
利用深度学习做多标签多分类问题时一般会遇到样本数量不均衡的问题,比以flickr30K样本集做图像标签为例,该样本集共有30000张图片,每张图片有5个标签,所有的标签合并在一起后,共有30W条摘要,下表为包含狗、猫、海豚和大象的标签的样本数量:
类别 狗 猫 海豚 大象 数量 10619 308 40 94
显然相对于包含狗的样本,其它的样本数量少到可以忽略不计。而目前主流的基于深度学习的多分类方法中,最后一层的激活函数为sigmoid函数,该函数的值域为(0,1),其结果往往被用于作为某个标签的概率。模型的期望损失函数为:
其中,Ni为包含标签i的样本数量,Nj为不包含标签j的样本数量,Pi为模型预测标签i的平均概率,Pj为模型预测标签j的平均概率。
由于海豚标签的训练样本数量远小于狗标签的训练样本数量,就算海豚标签全部被预测错,只要把狗标签全部预测对,那么模型的损失也是很小的,因此用这样的样本训练出来的结果不可避免地会出现这样的问题:对于出现频率高的标签,模型预测的概率也相应偏高,这样的问题就是样本类别不均衡问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海爱数信息技术股份有限公司,未经上海爱数信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010166042.8/2.html,转载请声明来源钻瓜专利网。





