[发明专利]一种基于注意力残差学习的道路场景语义分割方法在审
申请号: | 202010745354.4 | 申请日: | 2020-07-29 |
公开(公告)号: | CN111860411A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 周武杰;吕营;强芳芳;周扬;雷景生;杨胜英;郭翔;马骁 | 申请(专利权)人: | 浙江科技学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 王灿 |
地址: | 310023 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 学习 道路 场景 语义 分割 方法 | ||
本发明公开了一种基于注意力残差学习的道路场景语义分割方法,应用于图像处理领域,具体步骤在于:选取训练集;构建神经网络,所述神经网络包括RGB图像通道和热图像通道,分别获取所述RGB图像和所述热图像的特征,并将所述特征依次经控制门模块和注意力残差模块处理;将选取的图像输入到所述神经网络中进行训练,得到训练集中对应的每幅分割预测图;计算训练集中的每幅所述RGB图像对应的所述分割预测图构成的集合与对应的所述真实标签图像构成的集合之间的损失函数值;重复训练并计算损失函数值,确定最优权值矢量和最优偏置项。本发明其具有较高的分割准确性,并且适用范围广。
技术领域
本发明涉及图像处理技术领域,更具体的说是涉及一种基于注意力残差学习的道路场景语义分割方法。
背景技术
语义分割在智能交通系统中有许多重要的应用,从交通场景理解、多目标障碍检测到视觉导航。目前最常用的语义分割方法有SVM、AdaBoost、random forest等算法。这些算法主要针对二值化分类任务,对特定物体进行检测和识别,如路面、车辆、行人。这些传统的机器学习方法往往需要专家进行特征工程,从而阻碍了不同场景下语义分割机器学习技术的快速发展。近年来,深度学习取得了突破性进展,在图像处理领域得到了广泛的应用。深度学习方法的一个优点是,它们有助于避免设计特征提取器。这使得它们可以应用于不同的任务,如语义分割,目标检测,图像分类。研究表明,深度学习技术特别适用于涉及复杂自然数据的任务,包括来自交通场景的图像数据。基于GPU的并行计算技术的发展有助于解决这一问题深度学习方法需要高计算复杂度的问题,从而使基于像素的交通场景语义分割成为可能。目前,深度学习的应用大大提高了图像分类任务的准确率。许多深度神经网络如AlexNet,VGG net,GoogLeNet在图像分类任务上都取得了很好的效果;最近的算法已经尝试使这些深度网络适应语义像素明智的分割任务,并且取得了一定的成就,考虑到为了实现户外交通场景分割存在的挑战在于交通场景更加复杂多变,系统需要获取更大距离上的深度信息,在恶劣的光照条件或者距离较远,深度相机受到限制。大多数已有的方法都需要精确的深度图作为场景分割的输入,这严重限制了方法的应用。
因此,如何提供一种适用范围广、分割准确性高的道路场景语义分割方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于注意力残差学习的道路场景语义分割方法,其具有较高的分割准确性,并且适用范围广。
为了达到上述目的,本发明采用如下技术方案:
一种基于注意力残差学习的道路场景语义分割方法,具体步骤在于:
选取N幅RGB图像以及对应的热图像和真实标签图像,并构成训练集;
构建神经网络,所述神经网络包括RGB图像通道和热图像通道,分别获取RGB图像和热图像的特征,并将所述特征依次经控制门模块和注意力残差模块处理;
将训练集中的每幅RGB图像和热图像作为原始输入图像,输入到所述神经网络中进行训练,得到训练集中对应的每幅分割预测图;
计算训练集中的每幅RGB图像对应的分割预测图构成的集合与对应的真实标签图像构成的集合之间的损失函数值;
重复训练并计算损失函数值,确定损失函数值中最小值;所述最小值对应的权值矢量和偏置项对应作为所述神经网络的最优权值矢量和最优偏置项。
进一步,所述RGB图像通道包括五个第一神经网络块;五个所述第一神经网络块依次连接,上一级所述第一神经网络块的输出,作为下一级所述第一神经网络块的输入。
进一步,所述热图像通道包括五个第二神经网络块;上一级所述第二神经网络块经所述控制门模块处理分别作为下一级所述第二神经网络块的输入和所述注意力残差模块的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院,未经浙江科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010745354.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种深沟槽隔离栅格结构的制造方法
- 下一篇:一种可自由调节的显示屏支架