[发明专利]一种多结构多任务深度神经网络及其训练、分类方法在审
| 申请号: | 202011040925.0 | 申请日: | 2020-09-28 |
| 公开(公告)号: | CN112348048A | 公开(公告)日: | 2021-02-09 |
| 发明(设计)人: | 王伟平;李晓倪;周玉灿;周宇 | 申请(专利权)人: | 中国科学院信息工程研究所 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
| 代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100093 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 结构 任务 深度 神经网络 及其 训练 分类 方法 | ||
1.一种多结构多任务深度神经网络,其特征在于,包括M个特征提取单元,一个用于识别样本子类类别的分类分支CCB和由K个用于对超类进行分类的超类分类器组成的超类分类分支MSCBs;其中,M个特征提取单元依次连接用于提取样本的不同层级特征,第m个特征提取单元提取的样本特征层级低于第m+1个特征提取单元提取的样本特征层级;每一所述超类分类器分别与一对应的特征提取单元连接,用于基于所连接特征提取单元提取的样本特征识别样本的超类类别,不同所述超类分类器负责识别不同分层标记结构定义的超类类别;最后一个特征提取单元,即第M个特征提取单元,与分类分支CCB连接;M大于或等于K;
多结构多任务深度神经网络的损失函数为其中LCCB为分类分支CCB的损失函数,为超类分类分支MSCBs中第k个超类分类器的损失函数,k=1~K;使用标准的交叉熵损失函数来计算LCCB和是分类分支CCB对样本x预测的子类,c是第k个超类分类器对样本x预测的超类,c,是csk第k个分层标记结构Hk中的子类真实值,c是第k个分层标记结构Hk中的超类真实值;CS为超类真实值集合,λk是平衡分层标记结构Hk对应的超类分类器和其他超类分类器影响的权重,K是分层标记结构的总数;φ(x,θ)为样本x在网络不同阶段的预测值,参数θ通过最小化损失函数L来学习得到。
2.如权利要求1所述的多结构多任务深度神经网络,其特征在于,所述超类分类分支MSCBs中的各超类分类器并行工作。
3.如权利要求1所述的多结构多任务深度神经网络,其特征在于,标准的交叉熵损失函数为其中N是类别数量,yi是类别标签,pi是类别为i的概率。
4.如权利要求1所述的多结构多任务深度神经网络,其特征在于,所述样本为具有分层标记结构的图像数据或文本数据。
5.一种如权利要求1所述多结构多任务深度神经网络的训练方法,其步骤包括:
1)将包含不同分层标记结构的样本构成的训练集输入到多结构多任务深度神经网络,进行多轮迭代训练;
2)采用验证集对每次训练后的网络进行测试,选择测试最佳结果作为最终的多结构多任务深度神经网络。
6.如权利要求5所述的方法,其特征在于,所述分层标记结构包括基于语义的分层标记结构和基于相似矩阵的分层标记结构。
7.如权利要求5或6所述的方法,其特征在于,采用指标对训练后的网络进行评价;其中,是预测的扩展集,包含分层标记结构中从根节点到预测的子类节点的路径上的所有节点;Caug是真实的扩展集,包含分层标记结构中从根节点到真实的子类节点的路径上的所有节点,|·|是计算元素数量的运算符。
8.如权利要求7所述的方法,其特征在于,计算每个分层标记结构中所有PH的平均值PHa、RH的平均值RHa;然后根据公式对训练后的网络进行评价;其中,是预测的扩展集,包含分层标记结构Hk中从根节点到预测的子类节点的路径上的所有节点;是真实的扩展集,包含分层标记结构Hk中从根节点到真实的子类节点的路径上的所有节点。
9.一种基于权利要求1所述多结构多任务深度神经网络的分类方法,其步骤包括:将一张未标记的图像输入多结构多任务深度神经网络,多结构多任务深度神经网络的各特征提取单元依次提取该图像的不同层级特征,选取若干个特征提取单元所提取图像特征分别输入到一对应的超类分类器,预测该图像的超类类别;分类分支CCB根据最后一个特征提取单元提取的该图像特征预测该图像的子类类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011040925.0/1.html,转载请声明来源钻瓜专利网。





