[发明专利]基于深度学习的实例级行人检测和行人重识别系统有效

专利信息
申请号: 201811615544.3 申请日: 2018-12-27
公开(公告)号: CN109670555B 公开(公告)日: 2023-07-07
发明(设计)人: 李文辉;刘家伦;王莹 申请(专利权)人: 吉林大学
主分类号: G06V40/10 分类号: G06V40/10;G06V10/82;G06V10/764;G06V10/25;G06V10/26;G06V10/774;G06F16/583
代理公司: 深圳紫晴专利代理事务所(普通合伙) 44646 代理人: 雒盛林
地址: 130000 吉林*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 实例 行人 检测 识别 系统
【权利要求书】:

1.基于深度学习的实例级行人检测和行人重识别系统,其特征在于,包括如下步骤:

S1:选择ResNet-50作为CNN模型的网络结构,其具有conv1和四个blocks,四个blocks包括conv2_x、conv3_x、conv4_x、conv5_x,每个blocks包含3,4,6,3个残差单元,利用conv1到conv4_3作为stemCNN部分,给定一张输入图像,stem产生1024个通道的convfeaturemaps;

S2:将获得的convfeaturemaps输入到pedestrianproposalnet中,在每个featuremap的每个位置上利用anchor机制和Softmax分类器判断前景和背景,同时采用线性回归调整anchor的位置,经过非极大值抑制,保留128个调整后的bbox作为proposals;

S3:将S2得到的featuremaps和proposals输入到ROIAlign中,根据proposals的坐标位置在featuremaps中将相应的区域池化为固定尺寸的特征图,方便后续的分类和包围盒回归操作,遍历每个proposal,将proposal分割成k*k个单元,利用双线性内插法计算四个坐标值,最后进行最大池化;

S4:将ROIAlign得到的固定大小的featuremaps输入到IdentificationNet中,IdentificationNet由ResNet-50的conv4_4至conv5_3组成,获得最终的featuremaps;

S5:为了获得实例级的语意分割,在ROIAlign后接入FCIS语意分割网络,对featuremaps进行上采样,获得最终的实例级语意分割的结果,在COCO数据上预训练的网络模型,该数据集中有81类,只关注行人这一类,直接拿过来使用,不分布参与训练;

S6:利用S4获得的featuremaps,经过globalaveragepooling获得2048维度的特征向量,经过Softmax分类器和线性回归获得行人的位置,将通过S4操作获得2048通道featuremaps,输入到一层globalaveragepooling层中,获得一个2048维度的特征向量,为了获取精度更高的分类和Boundingbox效果,再次使用Softmax分类器和线性回归获得行人的位置;

S7:将S6获得的2048维的特征向量投影到经过L2正则化后的256维向量子空间中,获得256维度的特征向量,用于行人的匹配。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811615544.3/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top