[发明专利]一种易于快速迭代更新的Logo检测方法有效

专利信息
申请号: 201811578524.3 申请日: 2018-12-24
公开(公告)号: CN109359207B 公开(公告)日: 2021-01-22
发明(设计)人: 王旻毅;房鹏展 申请(专利权)人: 焦点科技股份有限公司
主分类号: G06F16/53 分类号: G06F16/53;G06K9/62
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 陈建和
地址: 210032 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 易于 快速 更新 logo 检测 方法
【权利要求书】:

1.一种易于快速迭代更新的Logo检测方法,其特征在于,包括构建并训练L ogo检测模型至收敛,得到特征点Landmark 1,用于预测未知图片里的L ogo位置;构建并训练图片分类网络模型至收敛,得到特征点Landmark 2,用于预测L ogo类别,具体步骤如下:

步骤1,根据给定的关键字抓取搜索引擎的图片源,将图片的抓取结果分成4类:第1类,含Logo图片样本;第2类,没有多余背景的纯Logo;第3类,完全不相关的图片;第4类,不属于前3类的所有抓取结果;

步骤2,生成xml文件,记录矩形框位置及标注类别;

步骤2-1对步骤1中含Logo图片样本,使用开源工具labelImg对图片中Logo所在位置用矩形框进行标注,标注类别统一设为general_logo,将矩形框位置及标注类别保存为xml文件;

步骤2-2对步骤1中纯Logo做旋转操作;所述旋转操作为随机旋转,旋转角度可以是60°、120°、180°、240°或300°;然后将其嵌入完全不相关的图片的随机位置且不超出边界,合成新的有效图片,合成时记录纯Logo所在位置以及标注类别,写入xml文件;在步骤2-1获取的图片量不足1.5w张时,将合成的新的有效图片作为补充;步骤3,确定Landmark1最优模型;

步骤3-1,以tensorflow为统一框架,实现Faster RCNN,R-FCN,SSD以及附带的特征提取器,所述特征提取器包括Inception Resnet V2、Inception V2、Inception V3、MobileNet、Resnet 101、VGG;

步骤3-2,使用步骤1获取的图片以及步骤2生成的xml文件进行训练,获得Landmark 1最终模型;

步骤4,利用步骤3的Landmark 1批量抠取Logo,生成纯Logo图片,训练图片分类网络至收敛,得到Landmark 2,并预测Logo类别;

步骤5,当新增1类Logo时,收集至少100张的新Logo样本,重复步骤4,重新训练Landmark 2,并使用重新训练的Landmark 2预测新增L ogo的类别。

2.如权利要求1所述的一种易于快速迭代更新的Logo检测方法,其特征在于:所述步骤1中,图片样本包括至少100个类别;还对抓取结果进行筛选,具体方法为:对于含Logo图片样本,保留分辨率在300x300以上的抓取结果,对于没有多余背景的纯Logo,保留分辨率在150x150以上的抓取结果,对于完全不相关的图片,保留分辨率在300x300以上的抓取结果,数量为1千张,对于不属于前3类的所有抓取结果直接删除;筛选样本后的保留的有效样本数量为1万5千张。

3.如权利要求2所述的一种易于快速迭代更新的Logo检测方法,其特征在于:所述步骤5中,收集的新L ogo样本量为150张。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811578524.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top