[发明专利]一种用于矿井智能监控的视频图像编解码方法有效
申请号: | 201910014069.2 | 申请日: | 2019-01-08 |
公开(公告)号: | CN109672885B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 张帆;徐志超 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | H04N19/132 | 分类号: | H04N19/132;H04N19/42;H04N19/44;H04N7/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 矿井 智能 监控 视频 图像 解码 方法 | ||
1.一种用于矿井智能监控的视频图像编解码方法,其特征在于,采用基于机器视觉的卷积神经网络算法,实现对矿井视频图像的编码和解码功能,包括如下步骤:
步骤1,制作训练集和测试集:利用矿井视频图像采集设备采集图像,据此制作训练集和测试集;
步骤2,构建矿井视频图像的编码器网络和解码器网络:编码器网络包括拉伸层、降采样层,解码器网络包括升采样层、反拉伸层、3×3卷积层、二分支卷积层、标准化层、非线性激活层和深度变换层;
步骤3,网络训练:将训练集输入所述编码器网络,将所述编码器网络的输出作为所述解码器网络的输入,完成网络参数的训练;
步骤4,矿井视频图像的编码和解码:利用步骤3中训练好的网络,将步骤1中所述测试集中矿井视频图像输入步骤3中所述编码器网络,矿井视频图像经编码后传输至步骤3中所述解码器网络进行解码,输出矿井视频图像的重构结果;
其特征还在于,步骤2中所述的编码器网络首先在拉伸层将图像矩阵拉伸成待编码的图像,然后通过以下公式对信号进行降采样:
y=Φx
其中,为待编码的图像,为测量矩阵,是所述编码器网络的待学习参数,M<N,为编码结果;
进一步地,步骤2中所述的解码器网络由升采样层、反拉伸层、3×3卷积层、标准化层、非线性激活层、两个“升采样层-二分支卷积层”、深度变换层顺次连接而成,其中,所述二分支卷积层由两个分支分别连接到加法器,所述两个分支的第一分支由两个或两个以上的分支单元级联后连接至所述加法器,所述两个分支的第二分支直接连接至所述加法器,或通过单个分支单元后连接至所述加法器,所述分支单元由3×3卷积层、标准化层和非线性激活层顺次连接构成;
步骤2中所述的升采样层采用双线性插值法对图像进行升采样,得到第k个升采样层输出的图像的像素个数为Pk:
其中,n表示整个解码器网络中升采样层的数量,k=1,2,…,n,M表示解码器网络输入图像的像素个数,N表示来自数据集的原始输入图像的像素个数,符号表示向上取整;
步骤2中所述的标准化层采用批标准化对非线性激活层的输入数据的分布进行优化,以加快训练时的收敛速度,所述批标准化的过程如下:
1)训练时,对当前输入数据标准化:
其中,xi表示当前批次的样本中的第i个样本,表示对当前输入训练数据的标准化,μB表示当前批次的样本均值,表示当前批次的样本方差,ε为防止除以零的正常数,μB和通过以下公式获得:
其中,m表示当前批次的样本数量;
2)输出标准化层的训练结果:
其中,γ和β为网络训练的更新权值;
3)测试时,对当前输入测试数据标准化:
其中,表示对当前输入测试数据的标准化,和分别表示滑动均值和滑动方差,通过以下公式迭代计算得到:
式中,v是满足0<v<1的常数,和在训练时均初始化为0;
4)输出标准化层的测试结果:
步骤2中所述的非线性激活层采用LeakyReLU函数对输入的信号进行激活,得到:
其中,x表示图像批标准化后的特征图,a为满足0<a<1的常数;
步骤2中所述的深度变换层是一种卷积层,该卷积层的卷积核大小为1×1,卷积时采用的步长为1,边缘不补零,其深度与原始图像的深度一致;以及,
其特征还在于,步骤3中所述的训练过程包含以下子步骤:
步骤3-1,设定训练的最大迭代次数和训练停止所需的损失阈值,设定输入所述编码器网络和解码器网络的每批次样本的数量;
步骤3-2,采用Adam方法作为梯度下降方法,反向传播对网络参数进行训练;
步骤3-3,重复执行步骤3-2,直到达到步骤3-1所设定的最大迭代次数或达到步骤3-1所设定的损失阈值为止。
2.如权利要求1所述的方法,其特征在于,采用以下公式计算重构图像与原始图像的误差损失:
其中,MSE表示均方误差,m、n分别表示图像矩阵的行数和列数,I(i,j)表示原始图像中第i行第j列的像素值,K(i,j)表示重构图像中第i行第j列的像素值。
3.如权利要求1所述的方法,其特征在于,其中,所述矿井视频图像采集设备包括矿用本安型视觉传感器、矿用本安型相机和矿用本安型摄像机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910014069.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像硬件编码处理方法和装置
- 下一篇:一种图像帧预测方法、装置及头显设备