[发明专利]基于空间和通道联合注意力机制的无监督学习光流估计方法有效

专利信息
申请号: 202010409546.8 申请日: 2020-05-14
公开(公告)号: CN111582483B 公开(公告)日: 2022-12-13
发明(设计)人: 项学智;李诗洋;张荣芳;翟明亮;吕宁;邱瑜鉴;田大帅;乔玉龙 申请(专利权)人: 哈尔滨工程大学
主分类号: G06N3/08 分类号: G06N3/08;G06N3/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 150001 黑龙江省哈尔滨市南岗区*** 国省代码: 黑龙江;23
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 空间 通道 联合 注意力 机制 监督 学习 估计 方法
【权利要求书】:

1.基于空间和通道联合注意力机制的无监督学习光流估计方法,其特征是:

(1)构建融合空洞卷积的特征金字塔网络:该特征金字塔网络包含2个网络架构完全相同的分支,在特征金字塔的第1层至第4层的底层部分,每个分支网络通过连续的卷积层逐步提取两帧图像的低级特征图,在特征金字塔的第5层至第6层的高层部分,通过连续的卷积层提取两帧图像的高级特征图,训练过程中两个分支互相共享网络权重,以确保两个分支对第1帧图像和第2帧图像做相同的处理,计算两帧图像在不同金字塔层上特征图之间的特征图匹配代价cost volume,将其作为光流估计网络的输入;

(2)构建空间和通道联合注意力机制的光流估计网络:光流估计网络利用每层金字塔获得的特征图匹配代价cost volume进行光流估计,得到对应尺度的光流结果;

(3)利用正反一致性校验计算非遮挡区域:将第1帧图像和第2帧图像输入到网络中,以得到正向光流,之后调换两帧图像的顺序再次输入网络,得到反向光流,之后对正向光流和反向光流进行正反一致性校验,以此推断出前向遮挡区域和反向遮挡区域;

(4)构造无监督学习损失函数:将Census变换结合到光流估计网络中,并构建无监督损失函数,在网络训练过程中对非遮挡区域的像素点计算无监督损失,之后将每层金字塔对应的损失项加权求和,作为无监督光流估计网络的总体损失,以此约束网络的训练过程;

(5)训练阶段:在网络输入端输入无标签数据,通过对损失权重求和得到总损失,之后利用反向传播算法训练网络,得到最后的无监督光流估计模型;

(6)利用训练好的模型进行测试,输入为图像对,输出为对应的光流图;

步骤(1)特征图匹配代价cost volume的获取方式如下:

其中F1i(x1),F2i(x2)分别表示金字塔第i层上第1帧和第2帧的特征图,M表示特征图F1i(x1)和F2i(x2)的长度,T表示向量的转置操作,Fci(x1,x2)表示金字塔第i层上的特征匹配特征图匹配代价cost volume结果;

变形特征图由光流估计网络计算出的光流对第2帧图像的特征图进行变形得到,特征变性操作的定义如下:

Fi2′(p)=Fi2(p+φ(Oi-1(p)))

其中p表示图像中的像素点,Oi-1(p)表示金字塔第i-1层光流估计网络计算得到的光流结果,φ(x)表示上采样操作,Fi2(p)为金字塔第i-1层第2帧图像的特征图,Fi2′(p)表示变形后的特征图;

步骤(2)中,光流估计网络从金字塔第6层开始计算光流,计算得到的光流对第2帧图像的特征图进行变形,用于计算下一层的特征图匹配代价cost volume;第4层到第1层需要对本层的光流结果进行上采样,针对金字塔的第i层,首先计算金字塔第i-1层上的光流结果Oi-1,利用上采样操作使Oi-1与下一层金字塔尺度匹配,之后利用上采样光流对第i层的第2帧图像的特征图Fi2做变形操作,使变形后的特征图Fi2′更趋向于第1帧图像的特征图Fi1,其中第6层到第5层跳过上采样操作,最后利用变形后的特征图Fi2′(p)和第1帧图像的特征图Fi1(p)来计算特征图匹配代价cost volume,并将计算得到的特征图匹配代价cost volume输入到金字塔第i层对应的光流估计网络中,得到这一层对应的光流结果;

步骤(3)中,使用正反性一致性校验算法对遮挡部位的像素点进行识别,以剔除光流误差区域:当正向光流和反向光流之间的匹配值超过阈值,即该像素点为遮挡像素点,对图像上所有像素点进行检验,将超过阈值的像素点用前向遮挡参数f和后向遮挡参数b标记,以此求出所有像素点的遮挡掩码;

步骤(4)中,将Census变换应用到数据项约束中,具体实现公式如下,

其中,W(p)表示以p为中心像素点的矩形变换窗口,q为矩形窗内其他点,I(p)、I(q)分别为p、q像素点处的灰度值,为字符串连接符,σ为判别式的阈值;

将Census变换嵌入数据项中,得到下式,

其中,p表示图像中的像素点,O(p)表示光流估计网络计算得到的光流结果,表示鲁棒惩罚函数,f表示前向遮挡参数,b表示后向遮挡参数,表示第2帧图像的Census变换,表示第1帧图像的Census变换;

总损失函数由金字塔第2至第6层的损失函数加权求和得到,公式如下,

其中,λc分别表示不同金字塔尺度下Census损失函数所占的权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010409546.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top