[发明专利]一种敏感图片搜索方法和装置在审
申请号: | 201310226529.0 | 申请日: | 2013-06-07 |
公开(公告)号: | CN103294813A | 公开(公告)日: | 2013-09-11 |
发明(设计)人: | 方伟;苏鹏宇 | 申请(专利权)人: | 北京捷成世纪科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46 |
代理公司: | 北京庆峰财智知识产权代理事务所(普通合伙) 11417 | 代理人: | 刘元霞 |
地址: | 100191 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感 图片 搜索 方法 装置 | ||
1.一种敏感图片的搜索方法,其特征在于,包括如下步骤:
提取待查询图片上的局部特征向量集合并将图片生成为特征向量;
根据特征向量查找既定敏感图片库的倒排索引,得到与查询图片相关的各敏感图片;
计算待查询图片与各敏感图片之间的相似度,并按相似度对各敏感图片进行初排序;
利用图片特征点对初排序得到的各敏感图片进行筛选,如得到返回的结果图片为敏感图片,则报警。
2.根据权利要求1所述的方法,其特征在于:所述倒排索引建立包括:
对每张敏感图片进行局部特征点检测并提取出每个特征点空间邻域区域上的特征向量;然后对所有特征向量进行聚类,生成的聚类中心分别对应视觉词,从而构成视觉词典;
用所述视觉词典对敏感图片库中的所有敏感图片进行量化,形成倒排索引。
3.根据权利要求2所述的方法,其特征在于:所述用所述视觉词典对敏感图片库中的所有敏感图片进行量化时,
精简视觉词典,即对所有聚类中心下的特征向量个数进行统计和排序,将类中特征向量个数排在前T%的区分能力较弱的视觉词删除掉,其中T为预设阈值,其值根据生成视觉词典的视觉词分布结果来选取;
采用比值法来对所述特征向量量化到精简后的视觉词典中的视觉词进行评价;一个特征向量能够被量化为对应的视觉词,当且仅当所述特征向量在视觉词词典中进行2近邻查找时,返回的两个视觉词与所述特征向量之间的距离或相似度的比值Ratiodist,满足如下条件:
其中,和分别表示特征向量在视觉词典中查找返回的最近邻和次近邻视觉词;Dist<feature,和Dist<feature,分别表示所述特征向量feature与其最近邻视觉词和次近邻视觉词之间的距离值;Tratio(0<Tratio≤1)是一个预设的阈值,其值由生成视觉词典阶段统计正确量化结果而得。
4.根据权利要求2所述的方法,其特征在于:所述视觉词为一个高维向量,采用近似K-means方法来进行聚类。
5.根据权利要求1所述的方法,其特征在于:所述计算待查询图片与各敏感图片之间的相似度时,采用加权直方图相交方法来衡量图片之间的相似度;将两张图片的BOW特征向量进行归一化,对两个BOW特征向量进行IDF加权,对加权后的两个特征向量进行直方图相交运算,得到两张图片的相似度。
6.根据权利要求1所述的方法,其特征在于:所述对初排序得到的各敏感图片进行筛选时,利用图像特征点之间的局部分布关系以及全局几何约束条件来删除错误匹配的特征点对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷成世纪科技股份有限公司,未经北京捷成世纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310226529.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:影像文件搜索系统及方法
- 下一篇:千万千瓦级风电基地风机运行信息实时监测方法