[发明专利]一种基于卷积神经网络的不雅图片识别方法、终端、设备及计算机可读存储介质在审
申请号: | 201710752783.2 | 申请日: | 2017-08-28 |
公开(公告)号: | CN107665333A | 公开(公告)日: | 2018-02-06 |
发明(设计)人: | 王健宗;石磊;黄章成;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 深圳市精英专利事务所44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 不雅 图片 识别 方法 终端 设备 计算机 可读 存储 介质 | ||
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于卷积神经网络的不雅图片识别方法、终端、设备及计算机可读存储介质。
背景技术
随着网络数据的爆炸性增长和人们越来越大的个性化需求,人们每天通过网络能够获取海量数据,在丰富精神生活的同时,也因此暴露在海量信息面前,更易接触到各类色情信息,必须对信息进行过滤再展示到受众特别是儿童面前,因此鉴黄一直是信息过滤中极其重要的一环。传统的人工鉴黄对从业者有很高的要求,鉴黄师承受着巨大的心理和生理的双重压力,企业人工成本过高,审核效率低下,不能适用于需要大规模审核的场景。目前卷积神经网络这样的深度学习算法被广泛应用于图片识别中,并在降低网络模型复杂度、提升图片数据处理能力等方面取得了显著的成效,但是现有通过卷积神经网络进行图片识别得到的结果还是存在一定程度的误差。
发明内容
本发明实施例提供一种基于卷积神经网络的不雅图片识别方法、终端、设备及计算机可读存储介质,可以自动分析输入图片并对图片进行分类鉴别,大大提高了鉴黄的准确率,降低了鉴黄的成本。
一方面,本发明实施例提供了一种基于卷积神经网络的不雅图片识别方法,该方法包括:
对获取的待测图片数据进行预处理;
将预处理后的待测图片数据分别输入多个预设检测模型以对应地得到多个不同的置信度;
根据预设的线性加权比对所有的置信度进行计算以得到一图片置信度,其中,所述预设的线性加权比包括多个比值,所述比值的数量与所述卷积神经网络的数量相同,且每个比值均对应一不同的卷积神经网络;
判断所述图片置信度是否大于预设置信度;
若所述图片置信度大于预设置信度,判定所述待测图片数据为不雅图片数据。
进一步地,所述方法还包括:
将预设的图片数据分为训练集以及验证集;
利用所述训练集对多个不同的卷积神经网络进行训练,以得到多个对应的中间模型;
利用所述验证集对所有的中间模型进行验证,以得到多个对应的错误集,其中每个错误集均包括至少一个错误样本;
若其中一错误集中错误样本的数量大于或等于预设阀值,利用所述其中一错误集训练与所述其中一错误集相对应的中间模型以得到一个对应的新的中间模型;
利用所述验证集对所述新的中间模型再次进行验证,直至所述错误集中错误样本的数量小于预设阀值,并判定此时的新的中间模型为对应的预设检测模型。
进一步地,所述对获取的待测图片数据进行预处理,包括:
对获取的待测图片数据进行特征强化;
根据预设规则将特征强化后的待测图片数据进行划分以得到一个或多个子图片;
其中,将所有子图片输入每个检测模型,以使每个检测模型对应地得到一个或多个子置信度,并判定每个检测模型对应的最大的子置信度为该检测模型对应的置信度。
进一步地,所述对获取的待测图片数据进行特征强化,包括:
将获取的待测图片数据以及所有预设图片数据调整为256*256的RGB图片;
计算被调整为RGB图片后的所有预设图片数据的像素平均值;
将被调整为RGB图片的待测图片数据的像素减去所述像素平均值以得到特征强化后的待测图片数据。
进一步地,卷积神经网络的数量为两个,包括一个具有八层结构的第一卷积神经网络以及一个具有二十二层结构的第二卷积神经网络,其中所述第一卷积神经网络包括五个卷积层、两个全连接层以及一个概率统计层。
另一方面,本发明实施例还提供了一种基于卷积神经网络的不雅图片识别终端,该终端包括:
预处理单元,用于对获取的待测图片数据进行预处理;
检测单元,用于将预处理后的待测图片数据分别输入多个预设检测模型以对应地得到多个不同的置信度;
置信度计算单元,用于根据预设的线性加权比对所有的置信度进行计算以得到一图片置信度,其中,所述预设的线性加权比包括多个比值,所述比值的数量与所述卷积神经网络的数量相同,且每个比值均对应一不同的卷积神经网络;
判断单元,用于判断所述图片置信度是否大于预设置信度;
判定单元,用于若所述图片置信度大于预设置信度,判定所述待测图片数据为不雅图片数据。
进一步地,所述终端还包括:
分类单元,用于将预设的图片数据分为训练集以及验证集;
第一训练单元,用于利用所述训练集对多个不同的卷积神经网络进行训练,以得到多个对应的中间模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710752783.2/2.html,转载请声明来源钻瓜专利网。