[发明专利]一种基于帧间关系的视频实例分割方法及系统有效
| 申请号: | 201910681950.8 | 申请日: | 2019-07-26 |
| 公开(公告)号: | CN110443173B | 公开(公告)日: | 2021-08-20 |
| 发明(设计)人: | 韩守东;刘昱均;郑丽君;夏晨斐 | 申请(专利权)人: | 华中科技大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青;李智 |
| 地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 关系 视频 实例 分割 方法 系统 | ||
1.一种基于帧间关系的视频实例分割方法,其特征在于,包括:
利用已标注的数据集对Mask R-CNN网络和FlowNet网络进行端到端的训练,从而在训练完成之后得到目标Mask R-CNN网络和目标FlowNet网络;
依次获取待处理视频中的每一帧图像,并在获取到任意一帧视频帧Ii后判断其类型,若为关键帧,则利用所述目标Mask R-CNN网络对所述视频帧Ii进行实例分割,否则,获得与所述视频帧Ii属于同一分组的关键帧Ik,并利用预先构建的视频实例分割模型对所述视频帧Ii进行实例分割;
其中,每一个分组由一帧关键帧,以及该关键帧与下一关键帧之间的所有非关键帧组成;所述视频实例分割模型包括关键帧实例分割网络和非关键帧实例分割网络;所述关键帧实例分割网络为所述目标Mask R-CNN网络,所述关键帧实例分割网络用于提取关键帧的M层金字塔特征P1~PM后,根据所提取的特征对关键帧进行实例分割;所述非关键帧实例分割网络包括光流检测网络、特征传播网络以及分割网络;所述光流检测网络为所述目标FlowNet网络,用于计算关键帧与非关键帧之间的流场和尺度场;所述特征传播网络用于根据所述流场和所述尺度场将关键帧的金字塔特征P1~PM传播到非关键帧,从而得到非关键帧的特征P1′~PM′;所述分割网络用于根据非关键帧的特征P1′~PM′对非关键帧进行实例分割;
所述特征传播网络用于根据所述流场和所述尺度场将关键帧的金字塔特征P1~PM传播到非关键帧,从而得到非关键帧的特征P1′~PM′,包括:
对于关键帧的每一层金字塔特征Pm,根据所述流场将其中的每一个像素映射到非关键帧的特征Pm′中,并将所述特征Pm′与所述尺度场逐像素相乘,以对所述特征Pm′中的特征翘曲进行矫正;
其中,m表示金字塔特征中的层编号,1≤m≤M,特征翘曲为关键帧与非关键帧之间的流场。
2.如权利要求1所述的基于帧间关系的视频实例分割方法,其特征在于,所述分割网络为所述目标Mask R-CNN网络中的Ntask网络。
3.如权利要求1或2所述的基于帧间关系的视频实例分割方法,其特征在于,利用已标注的数据集对Mask R-CNN网络和FlowNet网络进行端到端的训练,包括:
基于Mask R-CNN网络和FlowNet网络建立端到端的神经网络训练模型;所述神经网络训练模型中,Mask R-CNN网络的Nfeat网络、FlowNet网络以及Mask R-CNN网络的Ntask网络依次连接;Mask R-CNN网络的Nfeat网络用于提取已标注的图像的金字塔特征;FlowNet网络用于融合计算Nfeat网络所提取的特征流的权值;Mask R-CNN网络的Ntask网络用于对FlowNet网络输出的图像生成候选区域,并从中筛选出感兴趣区域后进行感兴趣区域对齐,以及对所有对齐之后的感兴趣区域并行进行分类、回归和掩码分割,并对掩码分割结果进行边缘检测,最终得到分类损失Lcls、回归损失Lbox、分割损失Lmask和边缘损失Ledge,加和求得网络损失L;
将已标注的数据集中,每一幅已标注的图像作为一个训练样本,利用该数据集对所述神经网络训练模型进行训练;对于每一个训练样本,获得对应的网络损失L后,将损失误差梯度反向传播以更新所述神经网络训练模型的参数;
训练完成后,将所得到的Mask R-CNN网络和FlowNet网络分别作为所述目标Mask R-CNN网络和所述目标FlowNet网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910681950.8/1.html,转载请声明来源钻瓜专利网。





