[发明专利]基于深度学习的直梯人数统计方法及系统有效

专利信息
申请号: 201910023341.3 申请日: 2019-01-10
公开(公告)号: CN109858389B 公开(公告)日: 2021-06-04
发明(设计)人: 陈国特;王超;施行;王伟;蔡巍伟;吴磊磊 申请(专利权)人: 浙江新再灵科技股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06N3/04;G06N3/08
代理公司: 杭州天昊专利代理事务所(特殊普通合伙) 33283 代理人: 董世博
地址: 310051 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 人数 统计 方法 系统
【权利要求书】:

1.一种基于深度学习的直梯人数统计方法,其特征在于,包括以下步骤:

直梯监控摄像头通过相机有无人算法判断有人,开关门算法判断直梯门关闭,且轿厢在运行状态时开始分析请求,触发一张图像并调用直梯行人检测算法做目标检测;

在接收到分析请求后,根据触发图像的时间节点从主码流取一张图像,并开始调用YOLOv3算法进行分析得到最后的检测框;

通过检测框得到具体的直梯人数,并将数量写入数据库中,同时上报到云梯平台,

所述开始调用YOLOv3算法进行分析得到最后的检测框具体为:

首先将直梯行人图像做归一化处理,尺寸变换到416*416,再将图像网格化,若检测的目标中心落在某一个网格中,则该网格就负责预测该目标;YOLOv3使用K-means得到9个先验框,采取三个尺度的特征图预测,当输入为416*416时,特征图分别为13*13,26*26,52*52;每个yolo层使用三个先验框,根据先验框的大小,划分到3个尺度的特征图上,尺度大的特征图使用小的先验框;每个网格会预测多个bounding box,在训练时如果该网格预测的bounding box与标记的ground truth重叠部分最大,即可判断目标在网格内,网格专职负责目标的预测;部分时候,一个目标可能会被多次检测,造成目标框重复检测,非极大值抑制可以检测高度重叠的边界框,去除置信度最高以外的所有预测框,保证同一目标只输出一个检测框;所有预测框经过回归得到具体的坐标信息,以及分类类别;通过设置一个目标置信度阈值,其中置信度为目标类别的概率乘以预测目标与标定真值的重叠部分,高于阈值的预测框即是最后的检测框,

采取三个尺度的特征图预测,当输入为416*416时,特征图分别为13*13,26*26,52*52采用YOLOv3检测网络得到,具体为:YOLOv3检测网络在第一组DBL后使用了23个残差单元,6组DBL,并增加了卷积层得到13*13的特征输出用于大目标的检测;其中在23个残差单元,5组DBL后做了分支DBL与上采样得到26*26的特征与经过19个残差单元得到的26*26特征做了张量拼接,其中concat用于拼接相同尺度的张量,拼接后的张量经过5组DBL并增加了卷积层得到26*26的特征输出;其中该5组DBL后做分支继续做DBL与上采样得到52*52的特征,同时与经过11个残差单元得到的52*52特征做张量拼接,该拼接后的张量再经过6组DBL并增加了卷积层得到了52*52的特征输出用于小目标的检测;最终三层特征输出共同用于直梯行人的检测。

2.一种基于深度学习的直梯人数统计系统,其特征在于,包括:

分析请求模块,用于直梯监控摄像头通过相机有无人算法判断有人,开关门算法判断直梯门关闭,且轿厢在运行状态时开始分析请求,触发一张图像并调用直梯行人检测算法做目标检测;

直梯人数统计模块,用于在接收到分析请求后,根据触发图像的时间节点从主码流取一张图像,并开始调用YOLOv3算法进行分析得到最后的检测框;

写入上传模块,用于通过检测框得到具体的直梯人数,并将数量写入数据库中,同时上报到云梯平台,

所述开始调用YOLOv3算法进行分析得到最后的检测框具体为:

首先将直梯行人图像做归一化处理,尺寸变换到416*416,再将图像网格化,若检测的目标中心落在某一个网格中,则该网格就负责预测该目标;YOLOv3使用K-means得到9个先验框,采取三个尺度的特征图预测,当输入为416*416时,特征图分别为13*13,26*26,52*52;每个yolo层使用三个先验框,根据先验框的大小,划分到3个尺度的特征图上,尺度大的特征图使用小的先验框;每个网格会预测多个bounding box,在训练时如果该网格预测的bounding box与标记的ground truth重叠部分最大,即可判断目标在网格内,网格专职负责目标的预测;部分时候,一个目标可能会被多次检测,造成目标框重复检测,非极大值抑制可以检测高度重叠的边界框,去除置信度最高以外的所有预测框,保证同一目标只输出一个检测框;所有预测框经过回归得到具体的坐标信息,以及分类类别;通过设置一个目标置信度阈值,其中置信度为目标类别的概率乘以预测目标与标定真值的重叠部分,高于阈值的预测框即是最后的检测框,

采取三个尺度的特征图预测,当输入为416*416时,特征图分别为13*13,26*26,52*52采用YOLOv3检测网络得到,具体为:YOLOv3检测网络在第一组DBL后使用了23个残差单元,6组DBL,并增加了卷积层得到13*13的特征输出用于大目标的检测;其中在23个残差单元,5组DBL后做了分支DBL与上采样得到26*26的特征与经过19个残差单元得到的26*26特征做了张量拼接,其中concat用于拼接相同尺度的张量,拼接后的张量经过5组DBL并增加了卷积层得到26*26的特征输出;其中该5组DBL后做分支继续做DBL与上采样得到52*52的特征,同时与经过11个残差单元得到的52*52特征做张量拼接,该拼接后的张量再经过6组DBL并增加了卷积层得到了52*52的特征输出用于小目标的检测;最终三层特征输出共同用于直梯行人的检测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江新再灵科技股份有限公司,未经浙江新再灵科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910023341.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top