[发明专利]基于深度学习的厨余垃圾识别分类方法在审
申请号: | 202310224440.4 | 申请日: | 2023-03-09 |
公开(公告)号: | CN116152571A | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 杨建锋;张晨;愉滨铨;颜辰航;闫弘 | 申请(专利权)人: | 西北大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/77;G06V10/82;G06N3/0455;G06N3/0464;G06N3/08 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 周春霞 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 垃圾 识别 分类 方法 | ||
本申请涉及一种基于深度学习的厨余垃圾识别分类方法,包括:将包含至少一个厨余垃圾目标的待识别图片输入到厨余垃圾识别分类模型中,输出所述待识别图片中每个厨余垃圾目标的类别;在模型训练过程中,将图片识别转变为集合预测问题,通过使用可学习的目标查询替代参照框,使得识别过程更加灵活,在识别过程中学习全局信息,消除部分冗余框;最后使用二分图匹配算法去进行匹配,得到最优解,后续不需要NMS操作,简化了调参步骤。
技术领域
本申请涉及计算机图像识别与分类技术领域,具体地,涉及一种基于深度学习的厨余垃圾识别分类方法。
背景技术
目前,厨余垃圾分类工作大多采用人工分拣,但是投入大量的时间与精力,却没有很好的效果。随着图像识别算法的兴起,厨余垃圾分类开始摒弃传统分类理念,步入自动化分类进程。而当前大多的图像识别算法,不仅需要较强的先验知识,而且会生成很多的冗余框,需要使用非极大值抑制方法对其结果进行后续处理,使得算法的参数较为复杂。
发明内容
为了克服现有技术中的至少一个不足,本申请提供一种基于深度学习的厨余垃圾识别分类方法。
第一方面,提供一种基于深度学习的厨余垃圾识别分类模型构建方法,包括:
获取模型构建数据集;模型构建数据集中的元素为包含至少一个厨余垃圾目标的图片;
基于模型构建数据集对识别分类模型进行训练,得到训练后的识别分类模型;
训练后的识别分类模型包括卷积神经网络、transformer模块、FFN网络;卷积神经网络用于提取待识别图片的图像特征;transformer模块用于基于图像特征,得到待识别图片的最终特征;FFN网络用于根据最终特征,确定待识别图片中每个厨余垃圾的类别。
在一个实施例中,基于模型构建数据集对识别分类模型进行训练,得到训练后的识别分类模型,包括:
将模型构建数据集输入到卷积神经网络,提取图片的图像特征;
对图像特征添加位置信息,得到具有位置信息的图像特征;
将具有位置信息的图像特征输入到transformer模块,得到图片的最终特征;
将最终特征输入到FFN网络,输出多个预测框,每个预测框对应一个厨余垃圾目标的类别;
根据多个预测框和多个真实框,确定损失函数,并将损失函数进行梯度回传以更新模型的参数,得到训练后的厨余垃圾识别分类模型。
在一个实施例中,卷积神经网络包括多个卷积层、激励层和全连接层,多个卷积层中的第一个卷积层用于提取图像的浅层特征,其他卷积层用于根据浅层特征提取深层特征,激励层用于对深层特征进行非线性映射,得到映射后的特征图,全连接层用于提取分类特征图。
在一个实施例中,方法还包括:
对映射后的特征图采用平均池化法进行降维处理。
在一个实施例中,对图像特征添加位置信息,得到具有位置信息的图像特征,包括;
对图像特征进行使用一维卷积核进行一次维度压缩操作,得到一次维度压缩后的特征图;
确定一次维度压缩后的特征图中每个像素点的位置信息;
将位置信息添加到像素点中,得到处理后的特征图;
对处理后的特征图进行张量扁平化处理,得到二次维度压缩后的特征图,即具有位置信息的图像特征。
在一个实施例中,将图像特征输入到transformer模块,得到图片的最终特征,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310224440.4/2.html,转载请声明来源钻瓜专利网。