[发明专利]基于深度学习的直梯人数统计方法及系统有效
| 申请号: | 201910023341.3 | 申请日: | 2019-01-10 |
| 公开(公告)号: | CN109858389B | 公开(公告)日: | 2021-06-04 |
| 发明(设计)人: | 陈国特;王超;施行;王伟;蔡巍伟;吴磊磊 | 申请(专利权)人: | 浙江新再灵科技股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04;G06N3/08 |
| 代理公司: | 杭州天昊专利代理事务所(特殊普通合伙) 33283 | 代理人: | 董世博 |
| 地址: | 310051 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 人数 统计 方法 系统 | ||
1.一种基于深度学习的直梯人数统计方法,其特征在于,包括以下步骤:
直梯监控摄像头通过相机有无人算法判断有人,开关门算法判断直梯门关闭,且轿厢在运行状态时开始分析请求,触发一张图像并调用直梯行人检测算法做目标检测;
在接收到分析请求后,根据触发图像的时间节点从主码流取一张图像,并开始调用YOLOv3算法进行分析得到最后的检测框;
通过检测框得到具体的直梯人数,并将数量写入数据库中,同时上报到云梯平台,
所述开始调用YOLOv3算法进行分析得到最后的检测框具体为:
首先将直梯行人图像做归一化处理,尺寸变换到416*416,再将图像网格化,若检测的目标中心落在某一个网格中,则该网格就负责预测该目标;YOLOv3使用K-means得到9个先验框,采取三个尺度的特征图预测,当输入为416*416时,特征图分别为13*13,26*26,52*52;每个yolo层使用三个先验框,根据先验框的大小,划分到3个尺度的特征图上,尺度大的特征图使用小的先验框;每个网格会预测多个bounding box,在训练时如果该网格预测的bounding box与标记的ground truth重叠部分最大,即可判断目标在网格内,网格专职负责目标的预测;部分时候,一个目标可能会被多次检测,造成目标框重复检测,非极大值抑制可以检测高度重叠的边界框,去除置信度最高以外的所有预测框,保证同一目标只输出一个检测框;所有预测框经过回归得到具体的坐标信息,以及分类类别;通过设置一个目标置信度阈值,其中置信度为目标类别的概率乘以预测目标与标定真值的重叠部分,高于阈值的预测框即是最后的检测框,
采取三个尺度的特征图预测,当输入为416*416时,特征图分别为13*13,26*26,52*52采用YOLOv3检测网络得到,具体为:YOLOv3检测网络在第一组DBL后使用了23个残差单元,6组DBL,并增加了卷积层得到13*13的特征输出用于大目标的检测;其中在23个残差单元,5组DBL后做了分支DBL与上采样得到26*26的特征与经过19个残差单元得到的26*26特征做了张量拼接,其中concat用于拼接相同尺度的张量,拼接后的张量经过5组DBL并增加了卷积层得到26*26的特征输出;其中该5组DBL后做分支继续做DBL与上采样得到52*52的特征,同时与经过11个残差单元得到的52*52特征做张量拼接,该拼接后的张量再经过6组DBL并增加了卷积层得到了52*52的特征输出用于小目标的检测;最终三层特征输出共同用于直梯行人的检测。
2.一种基于深度学习的直梯人数统计系统,其特征在于,包括:
分析请求模块,用于直梯监控摄像头通过相机有无人算法判断有人,开关门算法判断直梯门关闭,且轿厢在运行状态时开始分析请求,触发一张图像并调用直梯行人检测算法做目标检测;
直梯人数统计模块,用于在接收到分析请求后,根据触发图像的时间节点从主码流取一张图像,并开始调用YOLOv3算法进行分析得到最后的检测框;
写入上传模块,用于通过检测框得到具体的直梯人数,并将数量写入数据库中,同时上报到云梯平台,
所述开始调用YOLOv3算法进行分析得到最后的检测框具体为:
首先将直梯行人图像做归一化处理,尺寸变换到416*416,再将图像网格化,若检测的目标中心落在某一个网格中,则该网格就负责预测该目标;YOLOv3使用K-means得到9个先验框,采取三个尺度的特征图预测,当输入为416*416时,特征图分别为13*13,26*26,52*52;每个yolo层使用三个先验框,根据先验框的大小,划分到3个尺度的特征图上,尺度大的特征图使用小的先验框;每个网格会预测多个bounding box,在训练时如果该网格预测的bounding box与标记的ground truth重叠部分最大,即可判断目标在网格内,网格专职负责目标的预测;部分时候,一个目标可能会被多次检测,造成目标框重复检测,非极大值抑制可以检测高度重叠的边界框,去除置信度最高以外的所有预测框,保证同一目标只输出一个检测框;所有预测框经过回归得到具体的坐标信息,以及分类类别;通过设置一个目标置信度阈值,其中置信度为目标类别的概率乘以预测目标与标定真值的重叠部分,高于阈值的预测框即是最后的检测框,
采取三个尺度的特征图预测,当输入为416*416时,特征图分别为13*13,26*26,52*52采用YOLOv3检测网络得到,具体为:YOLOv3检测网络在第一组DBL后使用了23个残差单元,6组DBL,并增加了卷积层得到13*13的特征输出用于大目标的检测;其中在23个残差单元,5组DBL后做了分支DBL与上采样得到26*26的特征与经过19个残差单元得到的26*26特征做了张量拼接,其中concat用于拼接相同尺度的张量,拼接后的张量经过5组DBL并增加了卷积层得到26*26的特征输出;其中该5组DBL后做分支继续做DBL与上采样得到52*52的特征,同时与经过11个残差单元得到的52*52特征做张量拼接,该拼接后的张量再经过6组DBL并增加了卷积层得到了52*52的特征输出用于小目标的检测;最终三层特征输出共同用于直梯行人的检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江新再灵科技股份有限公司,未经浙江新再灵科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910023341.3/1.html,转载请声明来源钻瓜专利网。





