[发明专利]一种基于视频图像的内容识别方法在审
申请号: | 201910556426.8 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110287876A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 孙绍辉;曹勇;田云龙;孙绍光 | 申请(专利权)人: | 黑龙江电力调度实业有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 150000 黑龙江省哈尔滨市经*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频图像 内容识别 关键帧图像 图像识别 网络模型 人工智能领域 视频图像识别 对视频图像 光流场信息 两帧图像 内容对象 视频内容 特征传输 关键帧 光流法 实时性 帧图像 构建 图像 | ||
1.一种基于视频图像的内容识别方法,其特征在于,包括以下步骤:
步骤1、构建图像识别网络模型:
所述的图像识别网络模型的结构为:输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一特征拼接层、第二特征拼接层、输出层;所述第一特征拼接层拼接对第三池化层的特征图与第二池化层特征图进行特征拼接,然后卷积、批标准化、ReLU激活融合后再次经过进行注意力机制处理,将特征信息输入第二特征拼接层;第二特征拼接层将第一特征拼接层输入的特征图与第一池化层特征图进行特征拼接,然后卷积、批标准化、ReLU激活融合后再次经过进行注意力机制处理,将深度特征信息输入输出层;
步骤2、针对视频图像,提取关键帧图像;
利用图像识别网络模型对关键帧图像进行处理,确定图像的内容对象;
同时通过光流法计算出两帧图像间的光流场信息,将关键帧的特征传输到其他帧图像;
步骤3、针对步骤2的模型进行训练,得到训练好的最终识别模型;
步骤4、利用训练好的最终识别模型对视频图像的内容进行识别。
2.根据权利要求1所述的一种基于视频图像的内容识别方法,其特征在于,所述第一卷积层、第二卷积层、第三卷积层的激活函数为RELU。
3.根据权利要求1所述的一种基于视频图像的内容识别方法,其特征在于,提取关键帧图像的过程采用基于内容分析法提取关键帧图像。
4.根据权利要求1、2或3所述的一种基于视频图像的内容识别方法,其特征在于,针对步骤2的模型进行训练时损失函数都使用交叉熵损失函数,如下式所示:
其中N为选取的训练样本的总个数,k代表训练时选取的第k个样本,j为数据集的类别数目;pk表示第k个样本的概率,pk表示第j类的概率。
5.根据权利要求4所述的一种基于视频图像的内容识别方法,其特征在于,针对步骤2的模型进行训练得到训练后的最终识别模型后,利用测试集进行测试;如果最终识别模型满足识别率要求,则作为训练好的最终识别模型,否则返回步骤1重新调整模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黑龙江电力调度实业有限公司,未经黑龙江电力调度实业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910556426.8/1.html,转载请声明来源钻瓜专利网。