[发明专利]双分支多中心的长尾分布识别的方法有效
申请号: | 202110697276.X | 申请日: | 2021-06-23 |
公开(公告)号: | CN113255832B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 徐行;范峻植;沈复民;邵杰;申恒涛 | 申请(专利权)人: | 成都考拉悠然科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 谢建 |
地址: | 610041 四川省成都市中国(四川)自由贸易试验区成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分支 中心 长尾 分布 识别 方法 | ||
1.双分支多中心的长尾分布识别的方法,其特征在于,包括如下步骤:
步骤1.初始化两个采样器,一个采用默认采样,得到的图片输入默认分支,另外一个使用重采样策略进行采样,得到的图片输入重采样分支;
步骤2.对两个采样器得到的图片分别进行数据增强;
步骤3.将默认分支和重采样分支输出的图片进行数据增强后分别输入各自对应的深度卷积神经网络,提取出两张图片的高维特征表示,再将两张图片的高维特征表示分别在各自对应的深度卷积神经网络的卷积层中进行全局平均池化,得到各自的低维特征表示,其中,两个深度卷积神经网络的卷积层除了最后一个残差块的参数外共享;
步骤4.将默认分支经过卷积层得到的低维特征表示经过全连接层得到属于每个类别的概率,将重采样分支经过卷积层得到的低维特征表示乘以一个表示多中心的矩阵,得到特征矩阵,再对特征矩阵取行最大值,得到最终的属于每个类别的概率;得到的属于每个类别的概率的特征的维度为训练数据集中类别的数量,表示多中心的矩阵的维度为高维特征数、训练集类别数和中心数;
步骤5.将默认分支和重采样分支得到的属于每个类别的概率经过损失函数分别计算损失;
步骤6.默认分支的损失乘以权重⍺,得到默认分支的损失,重采样分支的损失乘以权重1-⍺,得到重采样分支的损失,⍺是一个从1到0的变量,然后将两个分支得到的损失进行相加,得到最终的损失,然后依据损失对深度卷积神经网络进行反向传播并更新权重;
步骤7.不断地迭代深度卷积神经网络,直到深度卷积神经网络收敛,使得深度卷积神经网络的识别准确率达到90%以上;
步骤8.当需要进行识别任务时,将图片输入重采样分支,并进行数据增强后输入深度卷积神经网络,得到图片属于各个类别的概率。
2.根据权利要求1所述的双分支多中心的长尾分布识别的方法,其特征在于,步骤1中,所述初始化两个采样器,一个采用默认采样,得到的图片输入默认分支,另外一个使用重采样策略进行采样,得到的图片输入重采样分支,具体是指:默认采样器按照每张图片使用相同的概率进行采样,然后将图片输入默认分支,重采样采样器通过重采样策略,首先对训练数据集进行统计,计算出每个类别所对应的图片数量,通过使用重采样策略,使每个类别的图片的采样概率相同,然后将图片输入重采样分支。
3.根据权利要求1所述的双分支多中心的长尾分布识别的方法,其特征在于,步骤2中,所述对两个采样器得到的图片分别进行数据增强,包括对图片进行左右翻转和/或随机裁剪和/或随机填充策略操作。
4.根据权利要求1所述的双分支多中心的长尾分布识别的方法,其特征在于,步骤3中,所述高维特征表示的维度为4096,低维特征表示的维度为64。
5.根据权利要求1所述的双分支多中心的长尾分布识别的方法,其特征在于,步骤5具体为:将两个分支得到的属于各个类别的概率分别和对应的图片的标签计算损失,通过损失函数得到两个分支各自的损失。
6.根据权利要求5所述的双分支多中心的长尾分布识别的方法,其特征在于,步骤5中,将两个分支得到的属于各个类别的概率分别和对应的图片的标签分别经过Cross Entropy损失函数,得到各自分支的损失, Cross Entropy损失函数的公式为:
;
其中,表示Cross Entropy损失函数的公式,表示总的类别数,表示当前图片属于第i类的概率,表示模型预测出当前图片属于第i类的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都考拉悠然科技有限公司,未经成都考拉悠然科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110697276.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:关联数据表的查询方法及装置
- 下一篇:带NFC功能的蓝牙适配器