[发明专利]一种图片快速预处理方法在审
申请号: | 201811185978.4 | 申请日: | 2018-10-11 |
公开(公告)号: | CN109543709A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 贾宇;张家亮;吴英俊;沈宜 | 申请(专利权)人: | 成都三零凯天通信实业有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都睿道专利代理事务所(普通合伙) 51217 | 代理人: | 薛波 |
地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 删除 网络图片 长宽比 神经网络算法 快速预处理 图片信息 检查 预处理 二维码图片 图像信息熵 倒数 过滤 网页 | ||
本发明公开了一种图片快速预处理方法,其特征在于:它包括如下步骤:S1:检查图片完整性,删除不完整的图片;S2:检查图片大小,删除图片长小于阈值L0或者宽小于阈值W0的图片;S3:检查图片长宽比Rlw,删除长宽比Rlw小于阈值Tlw的倒数或者长宽比Rlw大于阈值Tlw的图片;S4:检查图片信息熵H,删除图片信息熵H小于阈值H0的图片。该方法对网络图片进行预处理,筛除不完整的图片,尺寸极小的图片,装饰网页的图片,以及图像信息熵低的二维码图片,对图片针对性强,能够过滤掉大部分无效的图片,减少神经网络算法需要识别的网络图片,提高神经网络算法识别网络图片的速度。
技术领域
本发明属于图像识别技术领域,具体地说,涉及一种图片快速预处理方法。
背景技术
随着网络安全法的通过,如何监控互联网内海量图片成为了网络安全监控遇到的难点。现有的监控方法多是采用图像识别技术来识别出包含危险内容的图片并删除掉。随着基础理论的完善与计算能力的提高,基于神经网络的图像识别技术一起精度高的优势获得越来越多的关注和越来越广泛的应用。但是神经网络算法存在速度较慢的问题,面对海量的图片,需要使用的监控设备就需要较多。想要提高神经网络算法的工作效率,一方面是从神经网络算法本身进行运算改进,另一方面就是减少需要使用神经网络算法进行图像识别的图片的数量。
经过互联网数据的统计发现,互联网中有很大一部分的图片均为装饰网页的图片如按键的图标,推广用的二维码以及为保持网页格式而存在的其他图片,这些图片在人的感知范围内不可能包含危险内容,因此这些图片并不需要经神经网络对其中的内容进行识别,如果能够在神经网络识别图片前进行预处理,将这部分图片过滤掉,则可以大大提高神经网络算法识别网络图片的速度。
发明内容
针对现有技术中上述的不足,本发明提供一种图片快速预处理方法,该方法对网络图片进行预处理,筛除不完整的图片,尺寸极小的图片,装饰网页的图片,以及图像信息熵低的二维码图片,对图片针对性强,能够过滤掉大部分无效的图片,减少神经网络算法需要识别的网络图片,提高神经网络算法识别网络图片的速度。
为了达到上述目的,本发明采用的解决方案是:一种图片快速预处理方法,它包括如下步骤:
S1:检查图片完整性,删除不完整的图片;
S2:检查图片大小,删除图片长小于阈值L0或者宽小于阈值W0的图片;
S3:检查图片长宽比Rlw,删除长宽比Rlw小于阈值Tlw的倒数或者长宽比Rlw大于阈值Tlw的图片;
S4:检查图片信息熵H,删除图片信息熵H小于阈值H0的图片。
进一步地,所述的检查图片完整性包括如下步骤:
S101:读入图片;
S102:将所有图片转换为png格式;
S103:使用crc校验函数对转换后的png图片测试完整性;
若校验通过,则图片完整;
反之,则图片不完整;
S104:删除不完整的图片。
进一步地,所述的图片包括jpg格式图片、png格式图片或tif格式图片中的一种或多种。
进一步地,所述的检查图片大小包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都三零凯天通信实业有限公司,未经成都三零凯天通信实业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811185978.4/2.html,转载请声明来源钻瓜专利网。