[发明专利]一种数据处理方法及装置有效
| 申请号: | 201310712257.5 | 申请日: | 2013-12-19 |
| 公开(公告)号: | CN104731805B | 公开(公告)日: | 2018-12-07 |
| 发明(设计)人: | 白琳;王钢;张慧芳;陈昌文;王继伟 | 申请(专利权)人: | 中国移动通信集团广东有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
| 地址: | 510623 广东省广州市珠*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 | ||
本发明提供了一种数据处理方法及装置,其中,所述方法包括:获取待检测图片的第一特征值和图片库中的图片的第二特征值;根据所述第一特征值和所述第二特征值,获得所述待检测图片与所述图片库中的图片之间的特征距离值;对所述特征距离值进行归一化处理,获得归一化处理结果;根据所述归一化处理结果,获得所述待检测图片与所述图片库中的图片的相似距离。本发明提供的方案相对简单,能够有效定量得到特征间的距离,同时又能够方便的把多个特征的地位均衡;在对多个特征做归一化后的值均大于等于0,不同图片的特征有唯一的不同的归一化值,保证同样图片的距离归一后为0。通过技术改进提高了相似图片搜索的质量。
技术领域
本发明涉及图像图形中相似距离计算技术领域,特别涉及一种数据处理方法及装置。
背景技术
现有技术中计算图像图形的相似距离多使用如下四种方案:
方案一
现有的使用归一法计算多特征计算距离的方案。一般都会采用高斯归一算法,因为高斯归一效果比较好,一般会使用下面(1-1)公式最终的归一处理,简单但降低了搜索的质量。原因是距离小于0的多个距离值都被归一为0,而大于1的就被处理成1。
特征归到0到1区间
其中,Ni为每一个特征归一化后的值。
这个是被大量采用的方案,但有两个非常明显的缺点:
从公式(1-1)看出,多张图片的特征值在归一时可能因为小于0而被归成0,这样的话,不同的图片距离值变得一样,这明显是有问题的,不利于找到最合适的相似图。同样大于1的情况也存在类似的问题。同时在逻辑上来说,如果距离为0的话,理想应该就是2张一模一样的图片,理想的情况是不同的图片有不同的距离值。
由上分析得知,这样没有经过优化过的算法造成在相似搜索时质量变差,而精确搜索同样的图片时会出现多张不同的图片但距离值都是0。
分析原因:造成的原因是公式(1-1)简单归一造成的,小于零的距离值都被归成0,这样的话有多张图片的特征值在归一时都被归成0了,这时究竟哪张图片的距离是最小呢?在相似距离的判断中,这直接影响相似的排序和质量。简单地把这一步去掉也不行,这样的话就会存在负值了,负值的问题在于如果比较的2张图片是一样的,那计算出来的距离逻辑上应该为0才对。
方案二
聚类法-通过对多个特征进行聚类,使用K-MEAN等类似的聚类算法,得到相似特征集合。缺点是不方便定量得到精确的特征间的距离,结果粗糙,大多数时候是一个定性的结果。
方案三
直接使用广义欧氏计算公式进行多特征整合,如下:
其中,wi是权重。优点是能定量得到特征的距离,但是,多个特征之间的地位不平等,需要进行大量的试验确定wi来实现各个特征的平衡或者说是突出某一特征,即平衡各特征间地位的步骤相当复杂,而该步骤对相似度判断结果影响较大。
方案四
主成分分析法principal component analysis(PCA)
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。主成分分析法简介-principal component analysis(PCA)主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分;第二变量的方差次大,并且和第一变量不相关,称为第二主成分;依次类推。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团广东有限公司,未经中国移动通信集团广东有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310712257.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:专利检索相似度排序的方法
- 下一篇:一种实现页面适配的方法、平台及系统





