[发明专利]聚类分析方法、装置及设备在审
申请号: | 201410852005.7 | 申请日: | 2014-12-31 |
公开(公告)号: | CN104598544A | 公开(公告)日: | 2015-05-06 |
发明(设计)人: | 陈志军;张涛;关亚勇 | 申请(专利权)人: | 小米科技有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类分析 方法 装置 设备 | ||
1.一种聚类分析方法,其特征在于,所述方法包括:
对于待聚合类中的第一类和第二类,计算所述第一类和所述第二类中两两样本之间的距离,所述两两样本中一个样本来自于所述第一类,另一个样本来自于所述第二类;
将得到的样本距离按照预定顺序进行排序,确定指定数目个样本距离,所述指定数目根据所述第一类或所述第二类的类内聚合度调整得到;
根据所述指定数目个样本距离,计算所述第一类和所述第二类的类间距离;
根据所述待聚合类中每两个类之间的类间距离,对所述待聚合类进行聚类。
2.根据权利要求1所述的方法,其特征在于,当所述第一类和所述第二类的类间距离为平均距离时,所述根据所述指定数目个样本距离,应用如下公式,计算所述第一类和所述第二类的类间距离,包括:
其中,Gp指代所述第一类,Gq指代所述第二类;K为常数,指代所述指定数目;i为变量,i∈[1,K];dki指代所述指定数目个样本距离中第i个样本距离的大小;Dk(Gp,Gq)指代所述第一类和所述第二类的类间距离。
3.根据权利要求1所述的方法,其特征在于,当所述第一类和所述第二类的类间距离为中值距离时,所述根据所述指定数目个样本距离,应用如下公式,计算所述第一类和所述第二类的类间距离,包括:
Dk(Gp,Gq)=dkk/2
其中,Gp指代所述第一类,Gq指代所述第二类;K为常数,指代所述指定数目;dkk/2指代所述指定数目个样本距离中第K/2个样本距离的大小;Dk(Gp,Gq)指代所述第一类和所述第二类的类间距离。
4.根据权利要求1所述的方法,其特征在于,所述确定指定数目个样本距离之前,所述方法还包括:
根据所述第一类的样本数量和样本距离,计算所述第一类的类内聚合度;
根据所述类内聚合度,调整所述指定数目的大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司;,未经小米科技有限责任公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410852005.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文件操作方法
- 下一篇:用于快速查询响应的系统和方法