[发明专利]一种基于注意力模型的头肩部分图像分割方法及装置在审
申请号: | 201711375814.3 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107993238A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 李珊如;刘昕;袁基睿;山世光 | 申请(专利权)人: | 中科视拓(北京)科技有限公司 |
主分类号: | G06T7/12 | 分类号: | G06T7/12;G06T7/11;G06T7/194;G06N3/04;G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 模型 肩部 图像 分割 方法 装置 | ||
1.一种基于注意力模型的头肩部分图像分割方法,其特征在于,包括以下步骤:
步骤一、获取用于训练的图片数据集,并对图片进行标注;
步骤二、对训练样本进行数据拓充,得到的数据集;
步骤三、设计神经网络结构,将步骤二得到的数据集作为训练样本,进行网络训练;
步骤四、待测试的图片进行人脸区域检测,得到二维图谱;并将原图以及得到的二维图谱输入步骤三训练后的网络模型进行前向计算,通过端到端的提取方式将待测试图片中的头肩部分图像分割出来,得到分割结果图。
2.根据权利要求1所述的图像分割方法,其特征在于,还包括以下步骤:
步骤五、对步骤四得到的分割结果图运用导向滤波对细节进行优化。
3.根据权利要求1或2所述的图像分割方法,其特征在于:所述步骤一中的标注的方法为:手动勾勒人物边缘,得到三分图;将原图和三分图两张图作为输入,使用KNN算法得到其蒙版图;同时,对原图的人脸区域进行定位,将头部区域赋值为1,其他区域赋值为0,存储为灰度图像。
4.根据权利要求1-3中任一条所述的图像分割方法,其特征在于:所述步骤二中的数据拓充方法为:对已经标注好的图片进行背景切换;和对已经标注好的图片进行变化光照、增加遮挡以及添加噪声。
5.根据权利要求1-4中任一条所述的图像分割方法,其特征在于:所述步骤三中的神经网络为轻量级分割网络,在网络中以人物的脸部关键信息为注意力进行网络模型建模,所述神经网络包括6个依次级联的卷积网络基本单元,每个单元由依次连接的卷积层、局部响应归一化层、修正线性激活层、卷积层之间的残差连接、反卷积层和裁剪层组成。
6.根据权利要求2所述的图像分割方法,其特征在于:所述步骤五具体为,利用原图对分割结果进行滤波处理。
7.一种头肩部分图像分割装置,其特征在于,包括:
一个或多个计算机可读介质,其上具有多个模块、源图像储存库、目标图像储存库;
处理单元,其可操作地耦合到所述计算机可读介质,所述处理单元适于执行包括以下所述的模块:
图像输入模块,用于输入原始图像;
人脸识别模块,用于对待测试的图片进行人脸区域检测,得到二维图谱;
图像分割模块,用于基于训练好的神经网络对原始图像和二维图谱进行处理,以得到各个像素是头肩部分的分割结果图。
8.权利要求7所述的装置,其特征在于:所述神经网络的训练方法为:获取用于训练的图片数据集,并对图片进行标注;对训练样本进行数据拓充;设计神经网络结构,将拓充后的数据集作为训练样本,进行网络训练。
9.权利要求8所述的装置,其特征在于:所述神经网络为轻量级分割网络,在网络中以人物的脸部关键信息为注意力进行网络模型建模,所述神经网络包括6个依次级联的卷积网络基本单元,每个单元由依次连接的卷积层、局部响应归一化层、修正线性激活层、卷积层之间的残差连接、反卷积层和裁剪层组成。
10.权利要求7-9中任一条所述的装置,其特征在于,所述处理单元还包括:滤波模块,用于通过原图对得到的分割结果图进行滤波处理,对前景区域进行细节优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科视拓(北京)科技有限公司,未经中科视拓(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711375814.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:地电位带电作业玻璃绝缘子R销拔销器
- 下一篇:插拔式绝缘操作杆