[发明专利]一种基于视频图像的内容识别方法在审

申请号：	201910556426.8	申请日：	2019-06-25
公开（公告）号：	CN110287876A	公开（公告）日：	2019-09-27
发明（设计）人：	孙绍辉;曹勇;田云龙;孙绍光	申请（专利权）人：	黑龙江电力调度实业有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04
代理公司：	哈尔滨市松花江专利商标事务所 23109	代理人：	时起磊
地址：	150000 黑龙江省哈尔滨市经***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频图像内容识别关键帧图像图像识别网络模型人工智能领域视频图像识别对视频图像光流场信息两帧图像内容对象视频内容特征传输关键帧光流法实时性帧图像构建图像
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种基于视频图像的内容识别方法，本发明属于人工智能领域，具体涉及一种视频图像识别方法。本发明的目的为了解决现有基于视频内容的识别实时性不佳的问题。本发明首先构建图像识别网络模型，然后针对视频图像，提取关键帧图像；利用图像识别网络模型对关键帧图像进行处理，确定图像的内容对象；同时通过光流法计算出两帧图像间的光流场信息，将关键帧的特征传输到其他帧图像；然后对模型进行训练，得到训练好的最终识别模型；利用训练好的最终识别模型对视频图像的内容进行识别。本发明用于视频图像的内容识别。

技术领域

本发明属于人工智能领域，具体涉及一种视频图像识别方法。

背景技术

随着科技的逐步发展，自动驾驶技术、机器人技术等发展越来越快，技术相应越来越成熟，无轮是自动驾驶技术领域还是机器人技术领域等，想要实现自主识别并自主判断一般都是基于图像进行处理的，尤其是针对于自动驾驶和机器人的自主识别(运动过程中的避碰等)等大部分是基与视频图像进行处理的。

但是目前的视频图像处理有着一定缺点：视频的数据量庞大，不仅对于图像采集和图像处理等硬件有着非常高的要求，对于处理的软件环境也有着较高的要求，导致现有硬件或软件处理速度较慢，不能满足实时性的要求。尤其是针对于自动驾驶技术而言，对实时性判断的要求极高，如果不能满足实时性的要求，则无法保证行车安全，如果为了保证实时性的要求，那么就可能需要牺牲图像精度为代价，这样便降低了内容识别的准确性或这导致误报率升高，对行车安全同样存在着极大的安全隐患。同时这也是制约着对实时性有要求的机器人等领域的发展。

发明内容

本发明的目的为了解决现有基于视频内容的识别实时性不佳的问题。

一种基于视频图像的内容识别方法，包括以下步骤：

步骤1、构建图像识别网络模型：

所述的图像识别网络模型的结构为：输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一特征拼接层、第二特征拼接层、输出层；所述第一特征拼接层拼接对第三池化层的特征图与第二池化层特征图进行特征拼接，然后卷积、批标准化、ReLU激活融合后再次经过进行注意力机制处理，将特征信息输入第二特征拼接层；第二特征拼接层将第一特征拼接层输入的特征图与第一池化层特征图进行特征拼接，然后卷积、批标准化、ReLU激活融合后再次经过进行注意力机制处理，将深度特征信息输入输出层；

步骤2、针对视频图像，提取关键帧图像；

利用图像识别网络模型对关键帧图像进行处理，确定图像的内容对象；

同时通过光流法计算出两帧图像间的光流场信息，将关键帧的特征传输到其他帧图像；

步骤3、针对步骤2的模型进行训练，得到训练好的最终识别模型；

步骤4、利用训练好的最终识别模型对视频图像的内容进行识别。

本发明的有益效果为：

本发明构建的图像识别网络模型的参数能够控制在合理的范围内，同时本发明针对关键帧和非关键帧进行区分处理，从而保障了对视频内容进行识别的实时性；同时本发明的内容识别准确率也能够达到百分之九十，具有良好的视频图像内容识别效果。

附图说明

图1为构建图像识别网络模型的示意图。

具体实施方式

具体实施方式一：

一种基于视频图像的内容识别方法，包括以下步骤：