[发明专利]一种易于快速迭代更新的Logo检测方法有效
| 申请号: | 201811578524.3 | 申请日: | 2018-12-24 |
| 公开(公告)号: | CN109359207B | 公开(公告)日: | 2021-01-22 |
| 发明(设计)人: | 王旻毅;房鹏展 | 申请(专利权)人: | 焦点科技股份有限公司 |
| 主分类号: | G06F16/53 | 分类号: | G06F16/53;G06K9/62 |
| 代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
| 地址: | 210032 江苏省南京*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 易于 快速 更新 logo 检测 方法 | ||
1.一种易于快速迭代更新的Logo检测方法,其特征在于,包括构建并训练L ogo检测模型至收敛,得到特征点Landmark 1,用于预测未知图片里的L ogo位置;构建并训练图片分类网络模型至收敛,得到特征点Landmark 2,用于预测L ogo类别,具体步骤如下:
步骤1,根据给定的关键字抓取搜索引擎的图片源,将图片的抓取结果分成4类:第1类,含Logo图片样本;第2类,没有多余背景的纯Logo;第3类,完全不相关的图片;第4类,不属于前3类的所有抓取结果;
步骤2,生成xml文件,记录矩形框位置及标注类别;
步骤2-1对步骤1中含Logo图片样本,使用开源工具labelImg对图片中Logo所在位置用矩形框进行标注,标注类别统一设为general_logo,将矩形框位置及标注类别保存为xml文件;
步骤2-2对步骤1中纯Logo做旋转操作;所述旋转操作为随机旋转,旋转角度可以是60°、120°、180°、240°或300°;然后将其嵌入完全不相关的图片的随机位置且不超出边界,合成新的有效图片,合成时记录纯Logo所在位置以及标注类别,写入xml文件;在步骤2-1获取的图片量不足1.5w张时,将合成的新的有效图片作为补充;步骤3,确定Landmark1最优模型;
步骤3-1,以tensorflow为统一框架,实现Faster RCNN,R-FCN,SSD以及附带的特征提取器,所述特征提取器包括Inception Resnet V2、Inception V2、Inception V3、MobileNet、Resnet 101、VGG;
步骤3-2,使用步骤1获取的图片以及步骤2生成的xml文件进行训练,获得Landmark 1最终模型;
步骤4,利用步骤3的Landmark 1批量抠取Logo,生成纯Logo图片,训练图片分类网络至收敛,得到Landmark 2,并预测Logo类别;
步骤5,当新增1类Logo时,收集至少100张的新Logo样本,重复步骤4,重新训练Landmark 2,并使用重新训练的Landmark 2预测新增L ogo的类别。
2.如权利要求1所述的一种易于快速迭代更新的Logo检测方法,其特征在于:所述步骤1中,图片样本包括至少100个类别;还对抓取结果进行筛选,具体方法为:对于含Logo图片样本,保留分辨率在300x300以上的抓取结果,对于没有多余背景的纯Logo,保留分辨率在150x150以上的抓取结果,对于完全不相关的图片,保留分辨率在300x300以上的抓取结果,数量为1千张,对于不属于前3类的所有抓取结果直接删除;筛选样本后的保留的有效样本数量为1万5千张。
3.如权利要求2所述的一种易于快速迭代更新的Logo检测方法,其特征在于:所述步骤5中,收集的新L ogo样本量为150张。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811578524.3/1.html,转载请声明来源钻瓜专利网。





