[发明专利]一种敏感图片搜索方法和装置在审
申请号: | 201310226529.0 | 申请日: | 2013-06-07 |
公开(公告)号: | CN103294813A | 公开(公告)日: | 2013-09-11 |
发明(设计)人: | 方伟;苏鹏宇 | 申请(专利权)人: | 北京捷成世纪科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46 |
代理公司: | 北京庆峰财智知识产权代理事务所(普通合伙) 11417 | 代理人: | 刘元霞 |
地址: | 100191 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感 图片 搜索 方法 装置 | ||
技术领域
本发明属于图像处理领域,涉及一种广播电视节目和网络视频内容中的敏感图片搜索方法和装置。
背景技术
随着国家宽带网络的建设以及互联网的迅速发展,越来越多的网民通过网络视频网站来观看和分享内容丰富的视频节目。同时伴随着三网融合的发展,IPTV网络高清电视和互联网电视开始在普通家庭中普及。网络视频和电视节目的传播速度快、影响范围大。
在一些互联网视频和网络电视节目中,非法分子常常在视频内容中播放一些违法视频,或在视频画面中插入一些违法的敏感图片。现有的检测方法通常都是靠人工来审核,其缺点在于工作量巨大,且不具有实时性。
敏感图片指的是违法的、不健康的图片内容,例如一些违法的宣传标语、Logo、图画等等。目前较为常用的基于内容的图像检索技术主要分为两类:1)基于全局特征的图像检索;2)基于局部特征的图像检索。
基于全局特征的图像检索方法对每张图像提取一个或多个全局特征向量,并通过这些特征向量来描述该图像的内容,然后通过向量距离或相似度衡量方法来刻画两张图像之间的相似度。常用的全局特征有:颜色特征(颜色直方图、颜色矩等)、纹理特征(灰度共生矩阵、LBP、Gabor等)、形状边缘特征(边缘直方图、形状上下文等)。基于全局特征的方法简单,实现起来容易,但其缺点在于只能够查找原图或接近原图的图像内容,不能够查找原图中的部分子图像区域,且这类方法受光照、形变、尺度变化、遮挡的影响较大。由于敏感图片在视频中的出现可以是任意位置、大小和形态,因此,基于全局特征的图像检索方法不能够处理敏感图片的搜索问题。
基于局部特征的图像检索方法利用了局部图像特征具有光照不变性、旋转不变性、平移不变性、尺度不变性以及部分仿射不变性的特点来完成对原图像或相似图像的检索。这类方法的优点在于其不仅能够检索原图像,而且能够检索相似图像以及原图像的子图像,它能够容忍图像发生变化(例如:平移、旋转、缩放、仿射变换等)。常用的基于局部特征的图像检索方法包括:基于特征匹配的检索方法、基于BOW(Bag-of-Visual Words,视觉词袋)的检索方法。基于特征匹配的检索方法首先从图像中提取出局部特征向量,然后通过匹配方法(例如欧氏距离、直方图相交等)进行特征向量匹配,最后根据匹配成功的特征点对数来判断两张图像是否相似。这种方法的缺点在于:特征向量维数较高且待匹配图片集大时运算量会很大,从而检索时间耗费较大。常用的局部特征提取算子有:Harris,Laplace,DOG、Hessian等,局部特征描述算子有:MSER,SIFT等。
基于BOW(Bag-of-Visual Words,视觉词袋)的图像检索方法是在基于特征匹配方法的基础上进行修改得到的。其思想在于将文本检索领域中的词袋模型和倒排索引技术引入视觉图像检索中,目的在于使得检索速度能够得到较大的提升。该方法包含两个阶段:离线训练和在线检索。离线训练阶段用于生成视觉词典,并对数据库图片建立倒排索引;在线检索阶段对查询图片提取特征向量并量化成视觉词,然后通过倒排索引进行快速查询,返回相关的图片。基于BOW的图像检索方法的优点是检索速度快,适用于图片数目较大的图像检索,且其具有基于局部特征匹配方法的优点。但其缺点在于存在较大的量化误差,从而会存在较多的错误匹配。
因此,为了避免非法节目或视频的传播,需要对视频内容进一步进行分析检测,以便及时发现视频中出现的敏感图片。
发明内容
本发明的实施例提供了一种敏感图片搜索方法和装置,及时有效地查找视频中的敏感图片。
为达到上述目的,采用如下技术方案:
本发明公开了一种敏感图片的搜索方法,包括如下步骤:
提取待查询图片上的局部特征向量集合并将图片生成为特征向量;
根据特征向量查找既定敏感图片库的倒排索引,得到与查询图片相关的各敏感图片;
计算待查询图片与各敏感图片之间的相似度,并按相似度对各敏感图片进行初排序;
利用图片特征点对初排序得到的各敏感图片进行筛选,如得到返回的结果图片为敏感图片,则报警。
优选的,所述倒排索引建立包括:
对每张敏感图片进行局部特征点检测并提取出每个特征点空间邻域区域上的特征向量;然后对所有特征向量进行聚类,生成的聚类中心分别对应视觉词,从而构成视觉词典;
用所述视觉词典对敏感图片库中的所有敏感图片进行量化,形成倒排索引。
优选的,所述用所述视觉词典对敏感图片库中的所有敏感图片进行量化时,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷成世纪科技股份有限公司,未经北京捷成世纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310226529.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:影像文件搜索系统及方法
- 下一篇:千万千瓦级风电基地风机运行信息实时监测方法