[发明专利]度量视频连续帧与其卷积特征图间差异的系统及装置在审
申请号: | 201811138401.8 | 申请日: | 2018-09-28 |
公开(公告)号: | CN109344764A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 杨大伟;陈思宇;毛琳 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 刘斌 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 视频连续帧 时间信息 特征图 卷积 系统及装置 摄像头 度量 视频 计算机视觉应用 计算机存储 摄像头拍摄 参数更新 多条指令 反向传播 获取信息 视频数据 损失函数 梯度参数 下降过程 卷积核 处理器 加载 指令 计算机 拍摄 保留 | ||
1.一种度量视频连续帧与其卷积特征图间差异系统,其特征在于:包括摄像头及计算机,所述的摄像头用于拍摄视频,所述计算机存储有多条指令,所述指令适于处理器加载并执行:
将摄像头拍摄的视频连续帧数据与其对应卷积特征图用于计算,以获取二者的关于时间信息的差异;
将时间信息的差异作为卷积神经网络损失函数的一部分,参与卷积神经网络反向传播的梯度下降过程,使卷积核的梯度参数朝着保留输入数据时间信息的情况来进行参数更新。
2.如权利要求1所述的度量视频连续帧与其卷积特征图间差异系统,其特征在于:所述计算机基于如下方式获取关于时间信息的差异:
第一步:将视频转换为图像,得到总数为n的视频帧图像,取出所有原始视频图像帧xi,以及该图像帧对应的卷积特征图其中i代表帧数,将原始视频图像与卷积特征图分为两个集合,各集合内,相邻的两个图像作为集合内的一组待计算时间信息元素;
第二步:对维度不同的数据的进行补零升维或去零降维以使得各数据同维度,得到第二原始视频图像集合P′n-1与第二卷积特征图集合Q'n-1;
第三步:将第二原始视频图像集合P′n-1与第二卷积特征图集合Q'n-1的集合内的所有数据进行空间映射计算并求平均,得到第三原始视频图像集合f(x)与第三卷积特征图集合f(xc);其中f代表被映射的可再生核希尔伯特空间上的连续函数集;
第四步:对第三原始视频图像集合f(x)、第三卷积特征图集合f(xc),分别计算各集合内的各组待计算同维度时间信息元素的映射数据的差值,对差值求和并计算平均值,对所述两个均值作差并平方,得到时间信息的最大均值差异;
第五步:将时间信息的最大均值差异的数值作为卷积神经网络模型损失函数的一部分,参与网络反向传播中的梯度下降过程,使卷积核的梯度参数朝着保留输入数据时间信息的情况来进行参数更新。
3.如权利要求1所述的度量视频连续帧与其卷积特征图间差异系统,其特征在于:
第一原始视频图像集合表示为:
Pn-1={[x1,x2],[x2,x3],[x3,x4]…[xn-1,xn]}
第一卷积特征图集合表示为:
用算式表示时间信息的最大均值差异为:
4.如权利要求1所述的度量视频连续帧与其卷积特征图间差异系统,其特征在于:可再生核希尔伯特空间是利用可再生核函数作为空间内基础数据构成的具有完备性的内积空间,完备性代表该空间内任何函数的极限运算都不能脱离该空间的范围,内积空间为一种任意维度空间内任意数据都可进行内积并满足数据间共轭对称、线性性与正定性的空间,任何满足上述两个条件的空间都被称为希尔伯特空间,可再生核函数代表满足在无限维空间中拥有特征值与特征函数且任意特征函数都两两正交的核函数。
5.如权利要求1所述的度量视频连续帧与其卷积特征图间差异系统,其特征在于:所述计算机基于如下方式实现使卷积核的梯度参数朝着保留输入数据时间信息的情况来进行参数更新:卷积神经网络在更新各个卷积核的梯度时不仅运用了输出值与真实值的差异大小信息,也运用了最大均值差异来作为梯度更新的计算依据,使各个卷积核的梯度参数朝着减小最大均值差异的方向进行更新,减小两组时间信息的最大均值差异代表:随着梯度下降,两组时间信息的相似度趋向于增加,从而保证卷积神经网络能够更好的保留原始数据的时间信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811138401.8/1.html,转载请声明来源钻瓜专利网。