[发明专利]一种基于卷积神经网络的细粒度服装的属性识别方法有效
申请号: | 201811343657.2 | 申请日: | 2018-11-13 |
公开(公告)号: | CN109583481B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 张桦;陶星;戴美想;戴国骏;刘高敏 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06K9/20 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 细粒度 服装 属性 识别 方法 | ||
1.一种基于卷积神经网络的细粒度服装的属性识别方法,其特征在于包括如下步骤:
步骤(1)使用Faster-RCNN和YOLO神经网络对图像进行特征性区域判别,结合两种判别结果,分割出初步的特征区域图片;
步骤(2)对初步的特征区域图片做进一步的处理,由于袖长、裤长和领口类型的分类的特征区域分布略有不同,因此根据不同的分类需求,对特征区域进行扩大,防止特征信息丢失;
步骤(3)将图片处理成宽高相等的图片,根据袖长、裤长和领口类型这三种不同的分类任务,采用不同的填补方法,将细长和扁平的图片调整成宽高相等的图片;
步骤(4)构建两个深度卷积神经网络,对网络进行预训练,然后将经过图像处理的服装图输入到卷积神经网络中,利用随机梯度下降算法进行权重矩阵和偏移量的调整;
步骤(5)将得到的训练好的各层中的权重矩阵和偏置值,对应地赋值给两个神经网络中的各个层,再对各自的Softmax层进行调整,把两个网络结构的输出结果进行融合,减少过拟合现象,使结果更加准确。
2.根据权利要求1所述的一种基于卷积神经网络的细粒度服装的属性识别方法,其特征在于步骤(1)分割出初步的特征区域图片的方法如下:
1-1.将原始图像大小用两个坐标进行表示,分别是左上角顶点坐标(0,0)和右下角顶点坐标(width,height);初步的特征区域图片的左上角坐标定义(XA,YB),右下角坐标定义为(XC,YD);
1-2.通过深度学习方法中的通用目标检测框架Faster-RCNN和YOLO神经网络生成候选特征区域,使用Faster-RCNN和YOLO神经网络能够识别出图像中的主要特征区域,通过坐标的方式能够获取特征区域左上角和右下角的顶点坐标,通过Faster-RCNN神经网络获取的左上角坐标定义为(X1,Y1),右下角坐标定义为(X2,Y2);通过YOLO神经网络获取的左上角坐标定义为(X3,Y3),右下角坐标定义为(X4,Y4);
1-3.每张图像获取四个坐标后,通过如下四种情况得到初步的特征区域的左上角坐标( XA,YB),右下角坐标(XC,YD):
①两种目标检测网络均把原始图像作为判别区域,分割出初步的特征区域图片,即(X1,Y1)=(0,0),(X2,Y2)=(width,height),(X3,Y3)=(0,0),(X4,Y4)=(width,height);
②Faster-RCNN检测出小于原始图像的判别区域,YOLO把原始图像作为判别区域,分割出的初步的特征区域图片,即(X1,Y1)=(x1,y1),(X2,Y2)=(x2,y2),(X3,Y3)=(0,0),(X4,Y4)=(width,height);
③Faster-RCNN把原始图像作为判别区域,YOLO检测出小于原始图像的判别区域,分割出的初步的特征区域图片,即(X1,Y1)=(0,0),(X2,Y2)=(width,height),(X3,Y3)=(x3,y3),(X4,Y4)=(x4,y4);
④两种目标检测网络均检测出小于原始图像的判别区域,分割出的初步的特征区域图片,即(X1,Y1)=(x1,y1),(X2,Y2)=(x2,y2),(X3,Y3)=(x3,y3),(X4,Y4)=(x4,y4);
针对情况①:把原始图像作为初步的特征区域,即(XA,YB)=(0,0),(XC,YD)=(width,height);
针对情况②:把Faster-RCNN检测区域作为初步的特征区域,即(XA,YB)=(x1,y1),(XC,YD)=(x2,y2);
针对情况③:把YOLO检测区域作为初步的特征区域,即(XA,YB)=(x3,y3),(XC,YD)=(x4,y4);
针对情况④:结合两种检测区域,为了尽可能减少特征信息丢失,在取检测区域坐标遵从尽可能最大获取信息原则,(XA,YB)=(min(x1,x3),min(y1,y3)),(XC,YD)=(max(x2,x4),max(y2,y4))。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811343657.2/1.html,转载请声明来源钻瓜专利网。