[发明专利]一种基于深度学习模型Fast-Rcnn改进的警情自动化判定方法在审
申请号: | 201910301206.0 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110008927A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 轩素辉;欧阳文文;生拥宏;于绘娟;张瑞 | 申请(专利权)人: | 河南大华安防科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 廖曾 |
地址: | 450000 河南省郑州市高新技术*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 警情 卷积 判定 自动化 模拟视频信号 图像尺寸调整 图像采集卡 结果预测 目标设备 特征向量 图像采集 图像分类 网络提取 编写器 候选框 连接层 适配器 特征图 图像块 预测 映射 算法 像素 改进 存储 学习 返回 计算机 检测 移动 创建 网络 | ||
本发明公开了一种基于深度学习模型Fast‑Rcnn改进的警情自动化判定方法,包括以下步骤:S1:图像采集,采用图像采集卡或视霸卡将CCD或是CMOS摄像机的模拟视频信号经A/D后存储,然后送计算机进行处理;S2:候选框确定;S3:深度网络提取特征,CNN网络在卷积层之后会接上若干个全连接层,将卷积层产生的特征图映射成一个固定长度的特征向量,使用该像素周围的一个图像块作为CNN的输入用于训练和预测;S4:图像分类,对于对象的实际类可以特定于目标设备,由适配器负责创建并返回适当的编写器;S5:图像尺寸调整;S6:结果预测,最后两个loss层要改成一个softmax层,利用这种算法只检测人体的移动的时候,可以对真实警情程度能有很好的预测。
技术领域
本发明涉及计算机软件技术领域,具体为一种基于深度学习模型Fast-Rcnn改进的警情自动化判定方法。
背景技术
目前有成千上万的家庭和商户安装了安防摄像头,大多数的摄像头具有这样的功能,即当安防警报被触发时,摄像头会自动抓拍现场图片并且传回后方的安防控制中心。目前对于这些图像的处理基本为人工处理,即后台有工作人员点开图片观看来判定是否确实有警情,以及是否需要出警。这样的处理方式不仅速度慢,而且不具有统一性。不同人员的判断标准不一样,对于警情的判断难以统一,而且同一个工作人员在同一时间的判断标准也可能不一样。举一个例子,当工作人员疲劳是,判断的准确性可能会下降。
还有一个问题就是数据量的大小问题。每年安防的用户都在增长,目前可能人力还处理的过来,但是当用户数量多到一定程度的时候,所需要的人力太多,成本也就随之上涨,所以目前用人力判断的方法具有很多的弊端。
发明内容
本发明的目的在于提供一种基于深度学习模型Fast-Rcnn改进的警情自动化判定方法,不是通过检测物体的移动,而是利用算法只检测人体的移动的时候,对真实警情程度能有很好的预测,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于深度学习模型Fast-Rcnn改进的警情自动化判定方法,该警情自动化判定方法具体步骤如下:
S1:图像采集,采用图像采集卡或视霸卡将CCD(Charge Coupled Device,电荷耦合器件)或是CMOS(互补金属氧化物半导体)摄像机的模拟视频信号经A/D后存储,然后送计算机进行处理;
S2:候选框确定,图像归一化为224×224直接送入网络,前五阶段是基础的conv+relu+pooling形式,在第五阶段结尾,输入P个候选区域(图像序号×1+几何位置×4,序号用于训练),roi_pool层将每个候选区域均匀分成M×N块,对每块进行max pooling。将特征图上大小不一的候选区域转变为大小统一的数据,送入下一层;
S3:深度网络提取特征,CNN网络在卷积层之后会接上若干个全连接层,将卷积层产生的特征图映射成一个固定长度的特征向量,使用该像素周围的一个图像块作为CNN的输入用于训练和预测,程序中第6和32对应的是原网络中pool1和pool5层。整个网络输出的结果,你可以在最后通过输出结果对应到原网络大小,从而保存其他层的图片特征结果;
S4:图像分类,对于对象的实际类特定于目标设备,由适配器负责创建并返回适当的编写器,CIFAR102和CIFAR100数据库是Tiny的两个子集,分别包含了10类和100类物Images体类别;
S5:图像尺寸调整,oI池化层用于将不同大小的输入张量池化为固定大小,RoI池化层指定池化窗口的数量为W\times HW×H,每个池化窗口的大小是根据池化区域变化的,
S6:结果预测,最后两个loss层要改成一个softmax层,输入是分类的score,输出概率,最后对每个类别采用NMS,使用softmax得到分类,使用回归得到边框回归,CNN的主体结构可以来自于AlexNet,也可以来自于VGGNet。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南大华安防科技股份有限公司,未经河南大华安防科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910301206.0/2.html,转载请声明来源钻瓜专利网。