[发明专利]一种重图识别方法和装置在审
申请号: | 201911148718.4 | 申请日: | 2019-11-21 |
公开(公告)号: | CN112825146A | 公开(公告)日: | 2021-05-21 |
发明(设计)人: | 赵墨农;亢维盼 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 王安娜;陈继越 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 方法 装置 | ||
本发明公开了一种重图识别方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:确定图片对,基于与各个图片对应的像素带,确定图片对的重合像素带;根据合像素带的逆向文件频率和在各个图片中的出现次数,计算重合像素带在各个图片中的词频逆向文件频率占比;基于词频逆向文件频率占比生成对比指标向量,输入对比指标向量至逻辑回归模型,得到重图分类结果,以识别图片对是否为重图。该实施方式以像素分带、图片对的方式进行重图匹配,实现简单、准确率高,无需受限于数据量大小和分类随意变动的问题;无需进行图片标注,因此对于新品类/类型图片的识别无需进行标注和训练操作,以此实现了新品图片的快速响应。
技术领域
本发明涉及计算机技术领域,尤其涉及一种重图识别方法和装置。
背景技术
电商平台中同一物品可能在多家店铺售卖,其中可能存在盗图后的简单修改。从图片角度区分两个店铺所售卖是否为同一物品或近似物品,对于电商运营中的物品维权有很大的意义。
基于人工查找相同物品耗费人力、时间成本较高,由此现有主要利用多层卷积方式对图片进行主体识别,以确定要匹配的物品在图片中的位置,然后提取该位置处图片的特征向量,以此计算不同图片的相似度。
但实现本发明的过程中,发明人发现现有技术至少存在如下问题:
采用的多层卷积方式耗费资源量较大,且需在GPU(Graphics Processing Unit,图形处理器)服务器上运行,而GPU服务器价格昂贵,且复用率低;需要进行图片标注和机器学习,对于新类型的图片需要重新标注和训练,影响图片处理速度。
发明内容
有鉴于此,本发明实施例提供一种重图识别方法和装置,至少能够解决现有算法准确率低、耗费资源多、处理新分类速度慢的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种重图识别方法,包括:
确定图片对,基于与各个图片对应的像素带,确定所述图片对的重合像素带;其中,所述像素带为像素点的像素值所处的像素分带;
根据所述重合像素带的逆向文件频率和在各个图片中的出现次数,计算所述重合像素带在各个图片中的词频逆向文件频率占比;
基于所述词频逆向文件频率占比生成对比指标向量,输入所述对比指标向量至逻辑回归模型,得到重图分类结果,以识别所述图片对是否为重图。
可选的,在所述确定图片对之前,还包括:
接收图片集,对所述图片集中各个图片进行灰度处理,确定各个图片中各个像素点的灰度值;
根据各个图片中所有像素点的灰度值之和与像素点总数,得到各个图片的平均灰度值;
判断各个像素点的灰度值是否大于或等于相应图片的平均灰度值,若是则分配第一值,否则分配第二值;
根据各个图片中各个像素点的排列位置,对所述第一值和/或所述第二值进行排列,以构建各个图片的特征向量;
提取特征向量相同的图片并组成图片组,对所述图片组中的图片进行两两组合,得到图片对。
可选的,在所述对所述图片集中各个图片进行灰度处理之前,还包括:获取各个图片的尺寸,若所述尺寸小于或大于预定尺寸,则按照所述预定尺寸对图片进行放大或裁剪,得到调整尺寸后的图片。
可选的,在所述基于与各个图片对应的像素带,确定所述图片对的重合像素带之前,包括:
获取图片中各个像素点在多个颜色通道中的像素值;其中,所述多个颜色通道包括红色通道、绿色通道和蓝色通道;
根据各个颜色通道的像素带分布状态,确定与各个像素值对应的至少两个像素带;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911148718.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种组合式抽屉
- 下一篇:一种便于快速烘干的纸浆模塑产品