[发明专利]一种水下图像识别跟踪系统及方法有效
申请号: | 202010118383.8 | 申请日: | 2020-02-26 |
公开(公告)号: | CN111445496B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 谢英红;涂斌斌;韩晓微;唐璐;李华 | 申请(专利权)人: | 沈阳大学 |
主分类号: | G06T7/20 | 分类号: | G06T7/20;G06T3/00 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110044 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 水下 图像 识别 跟踪 系统 方法 | ||
本发明提供一种水下图像识别跟踪系统及方法,涉及计算机视觉技术领域。本申请包括仿射变换模块、候选框生成模块、跟踪模块、训练模块;通过接收水下视频图像序列,对所接收的图像序列中的图像进行仿射变换,以在当前的图像帧上标记出仿射框;基于所述仿射框,利用随机游走模型将仿射变换形成M个候选框;将M个候选框所确定的候选图像区域输入到深度卷积神经元网络从而获得M个得分,其中M为大于1的整数;以及将得分最高的候选框确定为所要识别的对象,并在该当前帧中划出该候选框作为被识别跟踪的对象。
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种水下图像识别跟踪系统及方法。
背景技术
近年来,水下机器人的出现进一步提高了我们认识和探索海洋的能力,它可代替人类在恶劣条件下完成任务。视觉系统是水下机器人应用的核心系统。但对于水下拍摄的视频图像,由于水体自身环境的复杂性、水下的不确定性动态因素、以及成像过程中水体对光线散射以及吸收效应产生的非线性影响都极大地降低了水下图像质量,导致图像对比度降低、纹理模糊。使得在陆地上行之有效的视觉检测与识别方法发挥的作用有限,目前还没有一种通用的方法可以处理所有场景下的图像。因此,研究开发一种高效地水下水下图像分类识别算法及系统,将具有重要的理论和应用价值。
发明内容
针对现有技术的不足,本发明提供一种水下图像识别跟踪系统及方法。针对水下图像的特点,通过训练CNN网络,能够实现水下图像的识别和跟踪功能。
为解决上述技术问题,本发明所采取的技术方案是:
一方面,本发明提供一种水下图像识别跟踪系统,包括包括仿射变换模块、候选框生成模块、跟踪模块、训练模块;
所述仿射变换模块用于接收水下视频图像序列,并对所接收的水下视频图像序列中的图像进行仿射变换,根据上一帧图像中标记出的仿射框而在当前帧上标记出当前帧中的仿射框;所述仿射变换模块在标记出各视频图像帧中的所述仿射框时,采用仿射变换表示各个图像帧中的目标的几何变形;
所述候选框生成模块,基于所述仿射框,利用随机游走模型将仿射变换,形成M个候选框;
所述跟踪模块,将所述M个候选框所确定的候选图像区域输入到深度卷积神经元网络,对深度卷积神经元网络进行训练,通过深度卷积神经元网络,分别进行卷积操作、激活操作、池化操作获得M个得分,其中M为大于1的整数,并将得分最高的候选框确定为所要识别的对象,以及在当前帧中划出该候选框作为被识别跟踪的对象;
所述训练模块用于对深度卷积神经元网络进行训练,从预定训练集中选择两个对象区域-标签对输入到所述深度卷积神经元网络;其中,所述两个对象区域-标签对包括:在光照充足的环境下拍摄的无噪声真值图像,以及在光照不足的环境下拍摄的含噪声训练图像;将所述含噪声训练图像用作初始图像以利用所述深度卷积神经元网络重建图像,将重建图像与所述无噪声真值图像进行比较以获得训练误差,以及将所述训练误差迭代反向传播经过所述深度卷积神经元网络以修正所述深度卷积神经元网络的参数,直至所述训练误差满足收敛条件。
另一方面,本发明还提供一种水下图像识别跟踪方法,采用上述的一种水下图像识别跟踪系统实现,该方法包括以下步骤:
步骤1:接收水下视频图像序列,对图像进行预处理,在对所述每一幅图像进行直方图均衡化之后,进行缩放、旋转、平移、剪裁中的一个或多个操作;
步骤2:对所接收的水下视频图像序列中的图像进行仿射变换,以在当前的图像帧上标记出仿射框;
步骤2.1:根据上一帧图像中标记出的仿射框而在当前帧上标记出当前帧中的仿射框;
步骤2.2:在标记出各视频图像帧中的所述仿射框时,采用仿射变换表示各个图像帧中的目标的几何变形。
步骤3:基于步骤2中所述仿射框,利用随机游走模型将仿射变换形成M个候选框;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳大学,未经沈阳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010118383.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序