[发明专利]一种联合人体检测与姿态估计的深度网络学习方法在审

专利信息
申请号: 201910672984.0 申请日: 2019-07-24
公开(公告)号: CN110532873A 公开(公告)日: 2019-12-03
发明(设计)人: 袁泽剑;赵云;郭子栋 申请(专利权)人: 西安交通大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08
代理公司: 61200 西安通大专利代理有限责任公司 代理人: 范巍<国际申请>=<国际公布>=<进入国
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种联合人体检测与姿态估计的深度网络学习方法,通过CNN模型联合整体与局部信息进行检测,该模型通过共享卷积层高效地提取底层特征,然后将这些特征分别通过两个并联的分支,进行人体检测与姿态估计。本发明通过暗含树结构推理算法的Fusion模型来融合人体检测和姿态估计的结果,以得到鲁棒可靠的人体检测框。本发明通过NMS算法(poseNMS),利用得到的人体部件的信息,有效地保留下相互遮挡的每一个个体。本发明使用树形结构模型将每个部分的信息嵌入到检测到的边界框中,并使用卷积网络实现推理算法。集合了整体建模与局部建模的优点,对于拥挤遮挡人群和和不常见姿态行为的行人拥有很好的检测效果,能更好的集成到实际应用中。
搜索关键词: 人体检测 姿态估计 推理算法 遮挡 检测 树形结构模型 底层特征 局部建模 局部信息 人体部件 网络实现 网络学习 有效地保 整体建模 边界框 共享卷 树结构 并联 积层 卷积 鲁棒 算法 嵌入 集合 拥挤 联合 融合 人群 应用
【主权项】:
1.一种联合人体检测与姿态估计的深度网络学习方法,其特征在于,包括以下步骤:/n步骤1:构建网络结构/n网络结构包括用于特征生成的body网络、人体检测网络H-CNN、人体姿态检测网络P-CNN以及用于整合人体检测网络H-CNN和人体姿态检测网络P-CNN结果信息的Fusion网络;具体构建方法如下:/n将图片通过多个卷积层生成共享特征图;/n将共享特征图应用于两个并行分支:人体检测网络H-CNN和人体姿态检测网络P-CNN;其中,/n①人体检测网络H-CNN使用两级网络结构,由区域提出网络RPN和微调网络RCNN组成;区域提出网络RPN利用共享特征图生成检测目标的候选框(bounding box),微调网络RCNN使用ROI-Pooling利用每个候选框提取特征,并使用这些特征进行分类和回归;人体检测网络H-CNN的检测结果表示为b=(x,y,w,h)和分数s(b),其中(x,y)表示候选框左上角点的坐标,(w,h)表示候选框的长度和高度;/n②人体姿态检测网络P-CNN:将人体解剖学上的关节点作为人体姿态关键点,并用树状图模型对其建模;关键点的集合表示为p=(p1,…,pi,…,pK),其中pi=(xi,yi)表示第i个关节点在图像中的位置坐标,K是关键点的数量;人体姿态检测网络P-CNN同时预测人体关键点的位置(2D置信图S)和关键点之间的连接关系,即向量场R;/n步骤2:建立Fusion模型/n基于人体检测网络H-CNN的检测结果,使用ROI-Align层将人体姿态检测网络P-CNN的估计结果(S,R)在感兴趣区域b内的部分调整为空间尺寸H×W的特征图,然后,利用Fusion模型将part的得分融合到人体检测的结果中;/n用(b,p1,…,pK)表示一个个体的整体和部分的位置,其中,b表示整体检测框的位置和大小,pK表示第k个关键点的位置;用树状图模型来建模人体的整体与各个部件之间的关系,其中根节点0表示检测框,其他节点表示不同的关键点,节点1表示颈部;每个人体检测的得分表示为:/n /n其中,wi和wi,j是每个关键点和连接关系的权重参数,用SVM训练得到;候选框的分数s(b)通过人体检测网络H-CNN得到,每个关键点的分数si(pi)通过人体姿态检测网络P-CNN输出的置信图S得到;r(b,p1)表示候选框和颈部之间的空间关系,计算方式为:/nr(b,p1)=-‖(x1,y1)-((x0,y0)+v1)‖2/n其中,(x0,y0)表示候选框的左上角点坐标,v1=(xv,yv)表示人体脖子的位置与候选框左上角的固定偏差;ri,j(pi,pj)表示每两个相连结点的连接关系,该值通过人体姿态检测网络P-CNN输出的PAF图Ri,j计算,计算方法如下:/n /n其中,pu=(1-u)pi+upi,表示两个相连关键点之间的插值坐标点;/n通过最大化候选框内所有关键点配置对应的分数来计算每个候选框的整体分数,表示为:/n /n最大分数的计算方法为:其中通过对叶子结点的递归计算得出:/n /n其中K(i)是指节点i的子节点的集合,若则表示i为叶子结点;/n为了让整个框架实现端到端连接以便在GPU上实现,通过卷积重构以上推理过程;将pk定位在以pi为中心长度为l的网格M中,递归算法中的和ri,k(pi,pk)表示为:/n /n /nwr为(1/Nu)·(pk-pi)/‖pk-pi‖,Nu是插值的数量;/n通过设计l2个卷积核来表示pk在M中的全部位置并将pk相对于pi的位置表示为pk′;卷积核的结构中,通道1中只有pk′被置1,其余元素均为0;通道2-3中从中心点到pk′的直线上的值被设为(1/Nu)·pk′/‖pk′‖,其余元素为0;/n对于成对关键点i和k,拼接Sk和Ri,k为一个三通道的特征图,并用设计的卷积核进行卷积操作,对生成的l2个结果取最大值,得到关键点部分的结果;随后用过卷积操作得到最终的得分完成推理算法;/n步骤3:非极大值抑制NMS方法PoseNMS/n在得到人体检测结果的集合{(b,p1,…,pK)}中,选择得分最高的检测结果,其部件配置为pi;如果检测结果j的第m关键点之间的距离小于α·max(hi,wi)且小于则将标记为被遮挡,其中hi,wi表示候选框的长宽;将第j个检测结果中所有被遮挡的部件标号记为oj;选取得分高于β的关键点检测结果记为IoUpose定义为:/n /n其中,为检测结果j中关键点m的得分;/n最终的NMS使用的IoU为:IoU=IoUoverlap+wposeIoUpose;其中,IoUoverlap表示传统的基于整体检测框的IoU值,wpose设为1并将IoU的拒绝域也设为1。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910672984.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top