[发明专利]一种基于无监督深度学习神经网络的图像特征提取方法在审
| 申请号: | 202310121708.1 | 申请日: | 2023-02-16 |
| 公开(公告)号: | CN116310395A | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 宋诗斌;朱杰;于凤洁;程炜皓;王海霞;卢晓;盛春阳;聂君;张治国;孙巧巧 | 申请(专利权)人: | 山东科技大学 |
| 主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/50;G06V10/77;G06V10/82;G06N3/0464;G06N3/048;G06N3/088;G06N3/084 |
| 代理公司: | 青岛智地领创专利代理有限公司 37252 | 代理人: | 张凯 |
| 地址: | 266590 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 监督 深度 学习 神经网络 图像 特征 提取 方法 | ||
本发明提供了一种基于无监督深度神经网络的图像特征提取方法,具体包括如下步骤:获取当前不同视点的图像,调整所有图像为统一大小,并转成灰度图;对灰度图进行单应性变换,新生成的图像与原图重新构成一组图像对,最后吧所有的图像对构成一个图像集;随机选择每个图像对中的一张图像构成图像组A,另一张图像构成图像组B;把图像组A中每张图片按图像长宽比进行分块;把图像组B作为无监督深度学习神经网络的输入;利用计算出的误差对无监督深度学习神经网络进行反向传播。本发明的技术方案克服现有技术中基于卷积神经网络的提取速度慢,且需要大量标注数据用于网络训练的问题。
技术领域
本发明涉及视觉SLAM技术领域,具体涉及一种基于无监督深度神经网络的图像特征提取方法。
背景技术
随着计算机科学和自动化技术的迅速发展,机器人开始被更多地应用于不同的生产生活场景中。视觉SLAM在室内场景下能够为机器人提供定位和导航服务,SLAM中的回环检测能够显著减小误差,提供更精准的定位导航结果。但同一个位置在不同时间的视觉观测可能会因为不同的视点、光线、天气和动态对象等因素而发生巨大变化,这为回环检测带来了难题。虽然现在已经有许多方法可以有效地在这些情况下执行,如场景流算法、语义分割算法等,能够对动态场景进行分割,但其处理速度较慢或者鲁棒性较弱,在挑战性强的场景中很难实时执行。
卷积神经网络凭借其强大的特征学习能力而在视觉识别领域广泛应用。现有基于卷积神经网络的提取速度慢,且需要大量标注数据用于网络训练。因此现需要一种操作简单、运行速度快的图像特征提取方法。
发明内容
本发明的主要目的在于提供一种基于无监督深度神经网络的图像特征提取方法,以解决现有技术中卷积神经网络的提取速度慢,且需要大量标注数据用于网络训练的问题。
为实现上述目的,本发明提供了一种基于无监督深度神经网络的图像特征提取方法,具体包括如下步骤:
S1,获取当前不同视点的图像{X1、X2、X3、…、Xn},调整所有图像为统一大小,利用灰度转换生成灰度图{Y1、Y2、Y3、…、Yn};
S2,对灰度图{Y1、Y2、Y3、…、Yn}进行单应性变换,其中对图像Y1变换生成新图像Y1`,Y2生成Y2`,以此类推,最后生成n个图像对{(Y1,Y1`)、(Y2,Y2`)、(Y3,Y3`)、…、(Yn,Yn`)};
S3,随机选择每个图像对中的一张图像构成图像组A,另一张图像构成图像组B;
S4,把图像组A中每张图片按图像长宽比进行分块,最终分成M块,对每一块图片进行尺度不变特征变换,提取出每块图片中一个关键点的信息,最后把M块图片提取出的关键点信息统计成M×128维的向量;
S5,把图像组B作为无监督深度学习神经网络的输入,利用无监督深度学习神经网络从图像中提取特征,生成N×4×14×19的特征地图,其中N代表输入图片个数,再利用三层全连接层生成M×128维图像的特征向量;
S6,利用L2损失函数对图像组A和图像组B中每张图像生成的2个M×128的一维向量进行误差计算,并利用计算出的误差E对无监督深度学习神经网络进行反向传播,逐层调整神经网络参数。
进一步地,步骤S1具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310121708.1/2.html,转载请声明来源钻瓜专利网。





