[发明专利]一种对彩色数字图像进行不良内容识别的方法有效
| 申请号: | 201010166984.2 | 申请日: | 2010-05-06 |
| 公开(公告)号: | CN101901346A | 公开(公告)日: | 2010-12-01 |
| 发明(设计)人: | 金城;丁汝一;冯瑞;薛向阳 | 申请(专利权)人: | 复旦大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;盛志范 |
| 地址: | 20043*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 彩色 数字图像 进行 不良 内容 识别 方法 | ||
技术领域
本发明属于数字图像处理技术领域,具体涉及一种彩色图像内容的分析与过滤方法,进一步则涉及一种数字图像拷贝检测和一种人体皮肤分割的方法,该系统可用于互联网不健康,暴力,反动图片的检测与过滤。阻止不健康内容的蔓延,保护青少年的身心健康。
背景技术
随着Internet使用的日益普遍,网络上存在的各种不良信息(色情、反动、暴力等等)越来越多地干扰着互联网的正常秩序。由于缺乏传统媒体对信息发布的有效监控,大量本应受到严格管制的信息因而随之泛滥。如何有效控制这些信息的传播,并保障网络的内容安全,成为不良信息检索、监控研究的主要内容之一。
现有的一些网络过滤系统大都是基于URL地址的过滤,该技术只是简单地对网络用户直接屏蔽掉设定在网络运营商防火墙中的不良内容网站URL地址数据库(俗称“黑名单”)中的网站,国内外市面上鲜有直接针对网络媒体(图像与视频)内容过滤的商用系统。虽然基于URL的屏蔽技术简单高效,但其却有着严重的局限性:由于网络运营商无法及时更新黑名单,这将导致很多新增色情网站成为漏网之鱼;同时,有些域名下并不是所有网页的内容都是不健康的,这又将导致一些正常内容被无辜屏蔽。基于媒体内容的过滤却没有以上局限性,该技术是直接针对网络上图片进行实时内容分析,决定该图片对象是否允许下载到客户端——所以基于内容的过滤技术必然是互联网过滤系统的发展趋势。然而,由于基于内容的过滤系统需要对媒体对象进行智能分析,对于不良图片的分析又分为暴力、反动,色情图片分析,不幸的是,到目前为止,这种语义级别的分析本身就是一个无法很好解决的难题。
经过大量观察我们发现,不良图片(暴力、反动、色情)图片在网上传输有两个特点,一个是数量大,另一个是具有重复性,也就是说一张同样的不良图片会被不同的人浏览多次,所以对不良图片的识别首先该系统采用拷贝检测的方法,不考虑很难解决的语义问题,而是搜集大量的暴力,反动,色情图片语料库,用待测图片和语料库中的图片进行比较,若有相似的图片,则认为其为不良图片。
此外,对于色情图片的检测,我们还可以依靠人体皮肤区域分割技术,加上人脸检测技术相互配合,解决色情图片的识别。
不过,人体皮肤区域分割技术本身就是一个无法很好解决的难题。在彩色数字图像中,人体皮肤的颜色由于受到两个主要因素的影响变化非常剧烈,这两个因素为:(1)本征肤色。不同的人种,如白种人、黄种人等,以及不同的身体条件,如不同的性别、年龄等,都会拥有完全不同的本征肤色;(2)光源条件。在剧烈的光照下,一些向光皮肤区域会呈现颜色极度不饱和现象,甚至完全变白,而背光皮肤区域则会变暗;皮肤同样还会反射环境光,就如同粉刷成白色的墙壁因为邻近棕色地板的反光而呈现出淡棕色。人类的视觉系统对于这些因素引起的皮肤颜色变化是极其不敏感的,这种现象可以由Land的“颜色不变现象(Color Constancy Phenomenon)”[13]解释;然而,数字设备在成像过程中却能精确地、客观地捕获皮肤颜色的这些变化,这种“客观性”直接导致了“通用肤色模型”无法包含所有的肤色种类,即“通用模型不通用”的尴尬。当然,包含所有的皮肤颜色并不是一件难事,但是这里的前提是,肤色模型不能把除肤色之外的背景颜色也同时提取出来,否则,肤色模型将没有任何意义。
经过大量观察我们发现,传统“通用肤色模型”或“一般肤色模型”([9,11,15,20])的局限性可以由两对致命的矛盾进行概括:(1)通用性与查全率。“通用肤色模型”的性能通常是在其容纳一般肤色信息和特殊肤色信息的能力之间找到一个最佳的权衡。如果过于强调通用性,模型中分配给各种肤色的能量都过于分散且微弱,检测时大多数的样本都能得到一定的置信度,但却不足够高,达不到肤色阈值,从而导致低查全率;(2)完整性与准确率。利用“通用肤色模型”检测出来的皮肤区域大多都很粗糙,不精确,因为在特定图像中,由于光照和阴影,很多情况下背景颜色比该图像中的真实皮肤颜色更为接近于一般皮肤颜色,因此,背景往往能得到比真实皮肤区域更高的置信度,如果此时因为强调皮肤区域提取的完整性而放松阈值想把皮肤阴影区域也提取出来,那后果就是更多的背景区域也相应被提取出,从而导致低准确率[5,6,10,16,21,22]。
以上的分析说明一个问题,就是“通用肤色模型”或者说“一般肤色模型(Generic SkinModel)”是不可能对所有的图像都有效的,它只能在一般与特殊之间取一个权衡来使性能最大化。所以我们可以建立专用肤色模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010166984.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种柱脚固定锚栓结构
- 下一篇:一种混凝土柱和钢梁的连接组件





