[发明专利]双分支多中心的长尾分布识别的方法有效
申请号: | 202110697276.X | 申请日: | 2021-06-23 |
公开(公告)号: | CN113255832B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 徐行;范峻植;沈复民;邵杰;申恒涛 | 申请(专利权)人: | 成都考拉悠然科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 谢建 |
地址: | 610041 四川省成都市中国(四川)自由贸易试验区成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分支 中心 长尾 分布 识别 方法 | ||
本发明属于计算机视觉领域,提出一种双分支多中心的长尾分布识别的方法,用于解决长尾分布数据集带来的问题。将图片输入默认分支和重采样分支进行数据增强后输入深度卷积神经网络得到低维特征表示;再经过全连接层得到属于每个类别概率,乘以一个表示多中心的矩阵得到特征矩阵并取最大值,得到最终属于每个类别的概率;分别计算损失;相加得到最终的损失,依据损失对网络进行反向传播并更新权重;不断地迭代;当需要进行识别任务时,将图片输入重采样分支,得到图片属于各个类别的概率。通过双分支多中心能减轻重采样带来的数据分布变化带来的影响,可进一步处理长尾分布带来的影响,带来更好的识别分类效果,并且模型拥有更好的泛化能力。
技术领域
本发明涉及计算机视觉领域,具体涉及一种双分支多中心的长尾分布识别的方法。
背景技术
随着深度卷积神经网络的飞速发展,图像分类的效果已经取得了令人惊叹的成果。这一成果和越来越丰富的数据集密不可分。在学术上,大部分数据集的类别标签数量分布几乎都是均匀的,但是,真实世界中的数据却是不均匀的,甚至呈现出长尾分布,即少部分类占据了大部分图片数量,这部分类别称为头部类,而剩下的类别只占有很少的图片数量,这部分类别称为尾部类,具体可查看图1。
现有的比较流行的处理长尾分布的方法包含重采样和重权重。重采样本质是对不同类别的图片采样频率根据样本数量进行反向加权。如果属于当前类的图片数量越多,则赋予当前类的图片的采样概率就越低,相反的情况下,对应的采样概率就越高。重权重则主要体现在分类的损失上,即给头部类的损失更低的权重,给尾部类的损失更高的权重。
上述两种方法,尽管都能得到更好的预测结果,但这些方法仍会产生不良影响,即会在一定程度上损害深度特征的表征能力。现有的一些方法都存在一些缺陷,具体缺陷如下:
1.当不对长尾分布问题采取任何措施的时候,长尾分布就会表现出对头部类的分类效果较好,而对尾部类的效果较差。并且头部类和尾部类的图片数量的最大比例相差越大,模型对尾部类的分类识别效果就会越差。
2.当对长尾分布数据集使用重采样策略时,即降低头部类别的采样概率,增加尾部类别的采样概率。这样虽然能缓解长尾分布带来的问题,但是也会产生另外一个问题。尾部类别图片的采样概率变高,就会改变特征空间数据的分布,影响模型的识别分类效果,具体可查看图4。
发明内容
本发明的目的是提供一种双分支多中心的长尾分布识别的方法,能够通过双分支的架构和多中心的设计来处理长尾分布数据集带来的问题。
本发明解决其技术问题,采用的技术方案是:
双分支多中心的长尾分布识别的方法,其特征在于,包括如下步骤:
步骤1.初始化两个采样器,一个采用默认采样,得到的图片输入默认分支,另外一个使用重采样策略进行采样,得到的图片输入重采样分支;
步骤2.对两个采样器得到的图片分别进行数据增强;
步骤3.将默认分支和重采样分支输出的图片进行数据增强后分别输入各自对应的深度卷积神经网络,提取出两张图片的高维特征表示,再将两张图片的高维特征表示分别在各自对应的深度卷积神经网络的卷积层中进行全局平均池化,得到各自的低维特征表示,其中,两个深度卷积神经网络的卷积层除了最后一个残差块的参数外共享;
步骤4.将默认分支经过卷积层得到的低维特征表示经过全连接层得到属于每个类别的概率,将重采样分支经过卷积层得到的低维特征表示乘以一个表示多中心的矩阵,得到特征矩阵,再对特征矩阵取行最大值,得到最终的属于每个类别的概率;
步骤5.将默认分支和重采样分支得到的属于每个类别的概率经过损失函数分别计算损失;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都考拉悠然科技有限公司,未经成都考拉悠然科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110697276.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:关联数据表的查询方法及装置
- 下一篇:带NFC功能的蓝牙适配器