[发明专利]学生网络处理方法、装置和电子设备在审
申请号: | 202110446338.X | 申请日: | 2021-04-23 |
公开(公告)号: | CN114881196A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 祝毅晨 | 申请(专利权)人: | 美的集团(上海)有限公司;美的集团股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N5/02 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 荣颖佳 |
地址: | 201700 上海市青浦区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学生 网络 处理 方法 装置 电子设备 | ||
本发明提供了一种学生网络处理方法、装置和电子设备。其中,该方法包括:获取学生网络的图像样本;将图像样本输入训练完成的教师网络中,得到图像样本的第一输出图像和至少一个第一中间特征图;基于第一中间特征图和第一输出图像提取图像样本的第一显著性特征,基于第一中间特征图提取图像样本的第一位置特征;基于第一显著性特征和第一位置特征,以及图像样本训练学生网络。该方式中,学生网络可以根据第一位置特征学习物体和物体之间的相对为位置信息,从而提升模型的性能;学生网络基于第一显著性特征进行训练,不仅仅是从空间角度去学习图像中的显著性特征,也从通道特征中提取了图像的显著性,从而加强了模型对显著性特征的学习能力。
技术领域
本发明涉及深度学习技术领域,尤其是涉及一种学生网络处理方法、装置和电子设备。
背景技术
目前,大多数知识蒸馏方案都是针对图像分类网络进行设计的,仅有的针对语义分割的知识蒸馏方案大多基于教师网络输出空间的结构性特征知识对学生网络进行蒸馏。这种继承于传统图像识别蒸馏方案的方法不够高效,也忽略了语义分割任务本身的特点。
语义分割任务通常需要模型学习图像的显著性信息和像素位置信息。现有的技术方案并没有针对语义分割任务特点而设计知识蒸馏方案。其次,现有的技术方案通常设计复杂而低效的对抗性学习网络来获得教师输出空间的结构性特征知识,使得训练过程变得尤为复杂。并且这种结构性特征知识只针对于教师输出空间,而遗漏了包含丰富语义结构性信息的标签,性能较差。
发明内容
有鉴于此,本发明的目的在于提供一种学生网络处理方法、装置和电子设备,以提高神经网络的性能,加强了模型对显著性特征的学习能力。
第一方面,本发明实施例提供了一种学生网络处理方法,方法包括:获取学生网络的图像样本;对于每个图像样本,均执行以下操作:将图像样本输入训练完成的教师网络中,得到图像样本的第一输出图像和至少一个第一中间特征图;其中,第一中间特征图由教师网络的至少一个中间特征层输出,第一输出图像由教师网络的输出层输出;基于第一中间特征图和第一输出图像提取图像样本的第一显著性特征,基于第一中间特征图提取图像样本的第一位置特征;其中,第一显著性特征表征第一中间特征图和第一输出图像的显著性信息,第一位置特征表征第一中间特征图的每个像素的位置信息;基于第一显著性特征和第一位置特征,以及图像样本训练学生网络。
在本发明较佳的实施例中,上述基于第一显著性特征和第一位置特征,以及图像样本训练学生网络的步骤,包括:将图像样本输入学生网络中,得到图像样本的第二输出图像和至少一个第二中间特征图;其中,第二中间特征图由学生网络的至少一个中间特征层输出,第二输出图像由学生网络的输出层输出;基于第二中间特征图和第二输出图像提取图像样本的第二显著性特征,基于第一显著性特征和第二显著性特征训练学生网络;基于第二中间特征图提取图像样本的第二位置特征,基于第一位置特征和第二位置特征训练学生网络。
在本发明较佳的实施例中,上述基于第一中间特征图和第一输出图像提取图像样本的第一显著性特征的步骤,包括:对第一中间特征图进行预设的第一特征概率计算,得到第一通道特征概率;对第一输出图像进行第一特征概率计算,得到第二通道特征概率;将第一通道特征概率和第二通道特征概率作为第一显著性特征;基于第二中间特征图和第二输出图像提取图像样本的第二显著性特征的步骤,包括:对第二中间特征图进行第一特征概率计算,得到第三通道特征概率;对第二输出图像进行第一特征概率计算,得到第四通道特征概率;将第三通道特征概率和第四通道特征概率作为第二显著性特征;基于第一显著性特征和第二显著性特征训练学生网络的步骤,包括:计算第一通道特征概率和第三通道特征概率的第一KL散度,基于第一KL散度调整学生网络的中间特征层参数;计算第二通道特征概率和第四通道特征概率的第二KL散度;基于第二KL散度调整学生网络的输出层参数;继续训练学生网络,直至训练结束。
在本发明较佳的实施例中,上述特征概率计算包括:将输入图像的3维张量特征转化为1维张量特征;基于预设的第一Softmax函数计算1维张量特征,得到输入图像对应的通道特征概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美的集团(上海)有限公司;美的集团股份有限公司,未经美的集团(上海)有限公司;美的集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110446338.X/2.html,转载请声明来源钻瓜专利网。