[发明专利]一种基于二进制卷积的人体姿态估计和人脸对齐的方法在审
申请号: | 201710186399.0 | 申请日: | 2017-03-24 |
公开(公告)号: | CN106951875A | 公开(公告)日: | 2017-07-14 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二进制 卷积 人体 姿态 估计 对齐 方法 | ||
技术领域
本发明涉及智能识别领域,尤其是涉及了一种基于二进制卷积的人体姿态估计和人脸对齐的方法。
背景技术
人体姿态估计和人脸对齐是现代计算机视觉领域的重要研究重要内容之一,在人机交互、虚拟现实、模式识别、智能监控系统、人体行为检测等领域有着广泛应用,例如公共场合中可疑人物的危险动作检测,在机场、火车等人口流动性强的场所的人脸对齐和识别等,这些对我们的生活的安全有着重要意义。卷积神经网络(CNN)是人体姿态估计和人脸对齐的关键技术,如今已取得许多可喜的成果,然而其估计和识别的效果并不理想,精确度和稳定性也有待提高。
本发明提出了一种基于二进制卷积的人体姿态估计和人脸对齐的方法,先以量化二进制沙漏网络作为基准,再通过增加残块的宽度和减少块中的参数数量,删除1×1卷积和使用3×3滤波器,使用良好的梯度流和具有层次的并行多尺度滤波等多个方面提高系统性能,最后计算损失。本发明通过使用具有层次的并行多尺度滤波,提高了性能和效率,也提高了精确度和稳定性,同时又不会过度增加二进制网络的参数;通过增加残块宽度,使信息量大大增加。
发明内容
针对精确度和稳定性不高等问题,本发明的目的在于提供一种基于二进制卷积的人体姿态估计和人脸对齐的方法,先以量化二进制沙漏网络作为基准,再通过增加残块的宽度和减少块中的参数数量,删除1×1卷积和使用3×3滤波器,使用良好的梯度流和具有层次的并行多尺度滤波等多个方面提高系统性能,最后计算损失。
为解决上述问题,本发明提供一种基于二进制卷积的人体姿态估计和人脸对齐的方法,其主要内容包括:
(一)二进制沙漏网络;
(二)增加残块的宽度和减少块中的参数数量;
(三)删除1×1卷积和使用3×3滤波器;
(四)良好的梯度流和具有层次的并行多尺度滤波;
(五)损失的影响。
其中,所述的二进制沙漏网络,从原始的沙漏网络开始,以类似的方式向前和向后进行量化;二进制通过以下方式实现:
其中,I是输入张量,W代表层的权值,α是缩放因子;表示可以用同或门实现二进制卷积运算。
其中,所述的增加残块的宽度和减少块中的参数数量,原始块由滤波器尺寸为1×1,3×3和1×1的三个卷积层组成,第一层具有限制第二层的宽度(即通道数)的作用,从而大大减少了模块内的参数数量;
通过将3×3薄层中的信道数量从128增加到256,增加残块宽度;这样增加了从一个块传递到另一个块的信息量。
进一步地,所述的残块,残块是沙漏网络的主要构建块,表示如下:
其中,xl+1和xl为一个块的输入和输出,是残差函数,表示单元参数。
进一步地,所述的减少块中的参数数量,通过减少块中的参数数量,匹配原始的参数数量;将块的输入—输出通道数量从256个减少到192个,使第一层中的通道数量从[256→128,3×3]变成[192→96,3×3],第二层从[128→4,3×3]变成[96→48,3×3],第三层[64→64,3×3]变成[48→48,3×3]。
其中,所述的删除1×1卷积和使用3×3滤波器,在二进制卷积神经网络中使用1×1卷积滤波器限制了神经网络的性能;通过去除1×1卷积,基准性能提高8%以上。
进一步地,所述的使用3×3滤波器,设计二进制网络时,应优先选择多尺度滤波器;将输入分为两个分支;第一分支的工作原理与原来相同,但具有1×1层,在进入3×3之前,将256个通道投影到64个;第二分支通过首先将输入通过最大汇集层进行多尺度分析,然后创建两个分支,一个使用3×3滤波器,另一个使用5×5分解成两个3×3滤波器;通过连接这两个子分支的输出,获得在原始块的128个信道中剩余的64个信道;最后,两个主分支连接128个通道,借助1×1个滤波器的卷积层,再次反向投影到256个通道。
其中,所述的良好的梯度流和具有层次的并行多尺度滤波,二进制网络对于衰落梯度的问题更为敏感,在网络中的梯度比实际对应的梯度要小10倍;因此设计具有层次的并行多尺度结构,允许每个分辨率具有两个不同的路径,其中最短的始终为1;模块内部分层结构的存在能有效适应较大的滤波器(高达7×7),分解成卷积层3×3过滤器;
良好的梯度流和具有层次的并行多尺度滤波能提高性能,但不会过度增加二进制网络的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710186399.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车桥防尘罩拉延模具
- 下一篇:一种汽车制动软管支架多工位级进模具