[发明专利]一种基于深度学习的人体轮廓提取方法有效
| 申请号: | 201810582283.3 | 申请日: | 2018-06-07 |
| 公开(公告)号: | CN109033945B | 公开(公告)日: | 2021-04-06 |
| 发明(设计)人: | 王林;董楠 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
| 代理公司: | 西安弘理专利事务所 61214 | 代理人: | 王欢 |
| 地址: | 710048*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 人体 轮廓 提取 方法 | ||
1.一种基于深度学习的人体轮廓提取方法,其特征在于,具体按照以下步骤实施:
步骤1,提取原始图像的Gabor纹理特征;
步骤2,提取原始图像的Canny边缘特征;
步骤3,搭建适用于人体轮廓提取的卷积神经网络架构:
步骤3.1,以VGG16网络模型为基础对VGG16网络结构进行修改,将VGG16网络模型中的5个卷积层缩减至4个,每个卷积层后接一个池化层,选择最大池化,池化窗口大小选择为2*2,移动步长为2;
设P为未知点的像素,Q11,Q12,Q21,Q22为P点周围已知像素的四个点,则已知函数f在Q11=(x1,y1),Q12=(x1,y2),Q21=(x2,y1)和Q22=(x2,y2)四个点的值,通过在x方向进行线性插值,得到两个中间点R1,R2的像素值f(R1)和f(R2),则将被池化的层填充得到原图像的大小:
其中,R1=(x,y1),R2=(x,y2);
再结合R1,R2在y方向进行线性插值,得到未知点P的像素值f(P):
最终得到未知点P的像素结果f(x,y)为:
进而生成反卷积结构;
步骤3.2,在步骤3.1的基础上引入网络中网络,即将每个原始的卷积层结构替换为MLP卷积层结构,具体为:
在一个原始卷积层后接若干个卷积核为1×1的卷积层,通过式(13)计算每一卷积层对上一卷积层的特征图:
式(13)中,(x,y)是特征图的像素索引,axy是中心在(x,y)的输入块,kt为特征图的索引,t为MPL的层数,f为激活函数,w为权值系数,b为偏置;
再通过ReLU激活输出当前层的特征图;
步骤3.3,在经步骤3.2处理的卷积层与反卷积层之间加入dropout层防止网络过拟合,则构成一个对称的卷积神经网络;
卷积神经网络为:
第一层为输入层,该层输入尺寸为:224*224*12;
第二层为卷积层,该层输入尺寸为:112*112*8;
第三层为卷积层,该层输入尺寸为:56*56*16;
第四层为卷积层,该层输入尺寸为:28*28*32;
第五层为dropout层,该层输入尺寸为:28*28*64;
第六层为反卷积层,该层输出尺寸为:56*56*32;
第七层为反卷积层,该层输出尺寸为:112*112*16;
第八层为反卷积层,该层输出尺寸为:224*224*8;
第九层为输出层,该层输出尺寸为224*224*1;
每个卷积层都有三个卷积子层,每两个3*3卷积核中间为一个1*1卷积核;
步骤4,将原始图像、步骤1提取的Gabor纹理特征图、步骤2提取的Canny边缘特征图共同传入步骤3构建好的卷积神经网络进行训练,生成CNN人物模型;
步骤4.1,将步骤1得到的8个方向的Gabor特征、步骤2得到的Canny边缘特征及原始图像的RGB三通道特征组成12个特征通道;
步骤4.2,将步骤4.1得到的12个特征通道的图像尺寸调整为224*224,再将12个特征通道传入步骤3构建好的卷积神经网络,以原始图像的groundtruth标签图作为CNN的教师信号进行训练,生成CNN人物模型;
步骤5,对训练好的CNN人物模型的结构进行测试,得到人体轮廓图像;
步骤6,通过步骤5的测试过程记录人体轮廓图像的重叠率与耗时,对人体轮廓图像进行评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810582283.3/1.html,转载请声明来源钻瓜专利网。





