[发明专利]数据对象的处理方法、处理装置及处理系统有效
| 申请号: | 201710998952.0 | 申请日: | 2017-10-23 |
| 公开(公告)号: | CN109697452B | 公开(公告)日: | 2021-09-14 |
| 发明(设计)人: | 汪振华;安山;麻晓珍;陈宇 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 赵婷 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 对象 处理 方法 装置 系统 | ||
1.一种用于处理图像数据对象以进行图像聚类的方法,包括:
从多个第一簇的每个第一簇中抽取至少一个特征数据,得到再分析数据,其中,每一个特征数据对应于一个图像数据对象,所述多个第一簇为将所有待聚类的图像数据对象的特征数据通过聚类而获得的,所述至少一个特征数据包括图像编码格式、图像中色彩分布、图形轮廓中的任意一项或多项;
基于所述再分析数据中特征数据的相似性,通过聚类将所述再分析数据重新归类为多个第二簇,所述多个第二簇的每个第二簇中包括所述再分析数据中的至少一个特征数据,其中,所述每个第二簇中的特征数据相似;
根据所述多个第二簇的每个第二簇中的特征数据在所述多个第一簇中的归类,将所述多个第一簇的每个第一簇的特征数据重新分配至对应的第二簇中;以及
当所述重新分配后的所述多个第二簇对应的聚类纯度与所述多个第一簇对应的聚类纯度的纯度差值大于预设的偏差阈值时,以所述重新分配后的所述多个第二簇为所述多个第一簇,重复执行所述抽取、重新归类、以及重新分配操作,直到所述纯度差值小于或等于所述偏差阈值时,输出所述重新分配后的所述多个第二簇;
其中,所述聚类纯度包括平均每个簇中的特征数据的个数,其中,基于每一个特征数据与一个图像数据对象的对应关系,所述纯度差值小于或等于所述偏差阈值时表征所有待聚类的图像数据对象的相似性的完整提取,以及平均每个簇对应的图像数据对象的个数满足完整提取条件;
其中,所述输出所述重新分配后的所述多个第二簇,包括:
输出的所述多个第二簇的总个数具有收敛性和一致性,使得对图像数据对象的特征数据的相似性的提取达到不能再提升的程度。
2.根据权利要求1所述的方法,其中,所述聚类纯度通过所述所有待聚类的图像数据对象的总个数与簇的总个数确定。
3.根据权利要求1所述的方法,其中,所述从多个第一簇的每个第一簇中抽取至少一个特征数据,包括:
从所述多个第一簇的每个第一簇中随机抽取一个特征数据。
4.根据权利要求1所述的方法,还包括:
通过聚类将所述所有待聚类的图像数据对象的特征数据归类为多个第一簇。
5.根据权利要求4所述的方法,还包括:
获取所述所有待聚类的图像数据对象中每一个图像数据对象对应的特征数据。
6.一种用于处理图像数据对象以进行图像聚类的装置,包括:
抽取模块,用于从多个第一簇的每个第一簇中抽取至少一个特征数据,得到再分析数据,其中,每一个特征数据对应于一个图像数据对象,所述多个第一簇为将所有待聚类的图像数据对象的特征数据通过聚类而获得的,所述至少一个特征数据包括图像编码格式、图像中色彩分布、图形轮廓中的任意一项或多项;
重新归类模块,用于基于所述再分析数据中特征数据的相似性,通过聚类将所述再分析数据重新归类为多个第二簇,所述多个第二簇的每个第二簇中包括所述再分析数据中的至少一个特征数据,其中,所述每个第二簇中的特征数据相似;
重新分配模块,用于根据所述多个第二簇的每个第二簇中的特征数据在所述多个第一簇中的归类,将所述多个第一簇的每个第一簇的特征数据重新分配至对应的第二簇中;以及
循环模块,用于当所述重新分配后的所述多个第二簇对应的聚类纯度与所述多个第一簇对应的聚类纯度的纯度差值大于预设的偏差阈值时,以所述重新分配后的所述多个第二簇为所述多个第一簇,重复执行所述抽取、重新归类、以及重新分配操作,直到所述纯度差值小于或等于所述偏差阈值时,输出所述重新分配后的所述多个第二簇;
其中,所述聚类纯度包括每个簇中的特征数据的个数,其中,基于每一个特征数据与一个图像数据对象的对应关系,所述纯度差值小于或等于所述偏差阈值时表征所有待聚类的图像数据对象的相似性的完整提取,以及平均每个簇对应的图像数据对象的个数满足完整提取条件;
其中,所述输出所述重新分配后的所述多个第二簇,包括:
输出的所述多个第二簇的总个数具有收敛性和一致性,所述多个第二簇中不存在可进一步合并的簇,使得对图像数据对象的特征数据的相似性的提取达到不能再提升的程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710998952.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





