[发明专利]一种同源图像检测方法和系统在审
| 申请号: | 201811267645.6 | 申请日: | 2018-10-29 |
| 公开(公告)号: | CN109614984A | 公开(公告)日: | 2019-04-12 |
| 发明(设计)人: | 孙婧;刘进;张帆;闫茜;张鋆 | 申请(专利权)人: | 深圳北斗应用技术研究院有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06T7/00 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 唐致明;洪铭福 |
| 地址: | 518000 广东省深圳市南山区桃*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 样本图像 同源 待检测图像 图像 神经网络 神经网络处理 图像检测 像素数据 分类 存储利用率 网络层结构 处理网络 概率判断 数据存储 系统执行 重复存储 层结构 第一层 概率 回归 检测 优化 | ||
本发明公开了一种同源图像检测方法和系统,方法:S1、处理样本图像以获取像素数据;S2、设置autoencoder神经网络,将像素数据作为第一层网络层结构的输入;S3、优化autoencoder神经网络;S4、采用softmax回归处理网络层结构的最后一层以进行样本图像的分类;S5、将待检测图像输入训练完成的autoencoder神经网络,判断待检测图像属于样本图像的分类中的一类的概率是否大于阈值,是则标记待检测图像为该类图像的同源图像。系统执行方法。通过autoencoder神经网络处理样本图像以进行训练,通过autoencoder神经网络处理待检测的图像并根据待检测图像属于样本图像的分类中的一类的概率判断是否属于同源图像,能够协助判断图像是否同源,借此作为数据存储的依据,能够降低重复存储的可能性,提高存储利用率。
技术领域
本发明涉及图像处理技术领域,尤其是一种同源图像检测方法和系统。
背景技术
近年来,随着互联网、云端的快速发展,在海量客户端不断地上传重复数据时,许多云端数据有大量的冗余,消耗了大量的带宽。
根据调查,企业重复删除的比率达1:10~1:500,如果第一个用户上传数据后,其他的用户再次上传时不需要重复上传,可以直接连接到已上传的数据进行传输,可以最大节省90%的网络带宽和磁盘空间,在云储存领域,数据去重能大大减少储存的空间与带宽,所以,当前提高资源利用率的最为迫切的是要解决数据高效去重问题。
单纯文字的确定重复是相对简单的,而图像之类的数据,难以简单的确认其是否存在重复,在图像去重领域,主要研究的是同源图像的检测,即判别多个图像内容是否来自同一图像,可以高效解决图像去重问题。目前,在信息通信研究领域,对图像去重的方法有很多,比较普遍的是基于内容、基于稀疏性和基于压缩感知等方法,均存在对应的缺点。
在比较图像相似度时,需要着重考虑两个重要的性能:第一,是要考虑数据删除的准确性,重复数据删除错误会给用户带来损失并影响服务质量;第二,是要考虑系统的可扩展性。所以图像去重等应用中的核心问题是数据删除的准确性,同源图像识别。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的是提供一种同源图像检测方法和系统。
本发明所采用的技术方案是:一种同源图像检测方法,包括步骤:S1、处理同尺寸的若干样本图像以获取对应的像素数据;S2、设置autoencoder神经网络,将所述像素数据作为所述autoencoder神经网络的第一层网络层结构的输入;S3、优化所述autoencoder神经网络,保留编码部分的网络层结构和对应的数据,丢弃解码部分的网络层结构和对应的数据;S4、采用softmax回归处理所述网络层结构的最后一层以进行样本图像的分类,当分类完成则所述autoencoder神经网络完成训练;S5、将待检测图像输入训练完成的autoencoder神经网络,判断待检测图像属于样本图像的分类中的一类的概率是否大于阈值,是则标记待检测图像为该类图像的同源图像。
优选的,步骤S2具体包括:S21、设置若干不同的RBM网络,所述RBM网络包括输入层和输出层,输入层的节点数大于输出层的节点数;S22、依节点数从大到小的顺序将不同的RBM网络中具有相同节点个数的输出层和输入层合并以形成autoencoder神经网络的网络层结构;S23、将所述像素数据作为所述autoencoder神经网络的第一层网络层结构的输入;S24、将S23得到各RBM网络的权值作为对应的autoencoder神经网络各网络层结构的初始权值。
优选的,所述优化所述autoencoder神经网络的步骤具体包括:通过最小化重构项和原始数据之间的误差来对权值进行训练,采用以交叉熵为目标函数的BP算法得到所需的梯度值,进而将自编码网络的权值更新到最佳值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳北斗应用技术研究院有限公司,未经深圳北斗应用技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811267645.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





