[发明专利]一种色情图像侦测的方法和系统有效
申请号: | 201110336168.6 | 申请日: | 2011-10-28 |
公开(公告)号: | CN103093180A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 薛晖 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 色情 图像 侦测 方法 系统 | ||
技术领域
本申请涉及图像识别的技术领域,特别是涉及一种色情图像侦测的方法和系统。
背景技术
随着互联网的快速发展,互联网在为人们认识世界、方便生活、提供帮助的同时,也为有害信息的广泛传播提供了便捷的途径,例如,人们常常会受到含有如色情、暴力等不健康的色情图像和视频的侵扰;网络犯罪活动的现象也日渐增多,如色情小说、色情图像和录像的传播,它们扰乱社会秩序、破坏社会风气,给人们尤其是青少年带来了极大的负面影响。
据统计,全球现有色情网站数以百万,另外,约28%的网站包含成人内容;一个人在互联网上随便点击每七次就有一次可能点击到色情站点,25%的小网迷曾主动访问色情网站,20%的人曾被动收到色情信息,全球75%的家长明确表示担心不良信息对孩子的负面影响;全球电子邮件中有大约55%是垃圾邮件,而其中色情图像大约占20%左右。
目前,过滤色情图像信息主要采用以下三种策略:
1、文本关键词过滤;
2、针对包含成人内容的网站建立黑名单,从而根据IP地址进行过滤;
3、基于内容进行图像识别。
对于第一种文本关键词过滤的方法而言,尽管文本检索、自然语言处理等技术已经发展地相当成熟,但单纯的基于文本过滤的方式,仍然存在着较大的漏杀率。主要原因之一在于文本修改的成本较低,恶意用户往往可以通过尝试不同的文字变形(错别字、象形文字等)来突破单纯依赖辞典的关键词过滤手段。另一方面,图像对人眼的冲击力往往更大(换言之,色情图像的危害程度相较文字更大),恶意用户甚至直接将文字印在图像上,对于这类情况,文本过滤的方式往往无能为力。
对于第二种根据黑名单网站IP地址进行过滤的方法而言,由于IP过滤的方式是一种静态防御的方式,无法第一时间发现包含成人内容的网站,而往往依赖其它技术或者人工举报的方式去维护黑名单。
与上述两种方法相比,第三种基于内容的图像识别技术通过分析、提取色情图像不同于正常图像的特征,作为机器判断的依据,提供了更灵活、直接且文字无关的处理手段。
传统的基于内容的图像识别技术,基本上单纯依赖皮肤颜色检测,往往会有较为严重的误判问题,即对于某些正常图像,只要其出现了黄色背景、纺织物、毛发等情况,都有很大概率会被过滤为色情图像。特别的,对于电子商务网站中存在的大量内衣、首饰等产品图像,存在十分严重的误杀率。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种色情图像的侦测技术,用以提高色情图像识别的召回率和准确率。
发明内容
本申请的目的是提供一种色情图像侦测的方法和系统,用以提高色情图像识别的召回率和准确率。
为了解决上述问题,本申请公开了一种色情图像侦测的方法,包括:
检测目标图像中的皮肤区域;
若所述皮肤区域在目标图像整体区域中的占比大于第一预设阈值,则检测所述目标图像中的连通域;
判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则判定所述目标图像为色情图像。
优选的是,所述检测目标图像中的皮肤区域的步骤进一步包括:
对目标图像进行肤色检测,获得候选皮肤区域;
在所述候选皮肤区域在目标图像整体区域中的占比大于第一预设阈值时,对所述候选皮肤区域进行纹理特征检测;
确定所述纹理特征强度大于第二预设阈值的候选皮肤区域为皮肤区域。
优选的是,所述判断连通域在皮肤区域中的分布是否满足预置规则的步骤进一步包括:
获取各连通域的面积,判断其中面积最大的连通域在皮肤区域中的占比是否大于第三预设阈值;
和/或,
获取各连通域的面积,判断其中面积大小在前n位的连通域,在皮肤区域中的占比是否大于第四预设阈值,所述n大于1。
优选的是,在所述判定目标图像为色情图像的步骤之前,还包括:
检测目标图像中的脸部区域;
若所述脸部区域在目标图像整体区域中的占比小于第五预设阈值,则根据所述脸部区域估算躯干区域,并检测躯干区域中的皮肤区域;
若所述躯干区域中的皮肤区域在躯干区域中的占比超过第六预设阈值,则判定所述目标图像为色情图像。
优选的是,所述第一预设阈值为20%;所述纹理特征检测采用边缘提取算法,所述第二预设阈值为5;所述第三预设阈值为5%;所述n为3,所述第四预设阈值为50%;所述第五预设阈值为65%;所述第六预设阈值75%。
本申请还公开了一种色情图像侦测的方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110336168.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种果蔬识别的方法及系统
- 下一篇:便于穿线的缝纫机机头
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序