[发明专利]最近邻分类装置及方法在审
| 申请号: | 201510711255.3 | 申请日: | 2015-10-28 | 
| 公开(公告)号: | CN106650759A | 公开(公告)日: | 2017-05-10 | 
| 发明(设计)人: | 刘汝杰 | 申请(专利权)人: | 富士通株式会社 | 
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 | 
| 代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 陶海萍 | 
| 地址: | 日本神奈*** | 国省代码: | 暂无信息 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 近邻 分类 装置 方法 | ||
1.一种最近邻分类装置,包括:
获取单元,所述获取单元用于获得测试样本的K个最近邻样本,K为正整数;
分组单元,所述分组单元用于根据所述K个最近邻样本的类别进行分组,其中,每个组对应于每个类别;
第一计算单元,所述第一计算单元用于计算每个组的权重;
第二计算单元,所述第二计算单元用于计算每个组的概率密度分布,并根据每个组的概率密度分布计算所述测试样本对于每个组的先验概率;
第三计算单元,所述第三计算单元用于根据每个组的权重和所述测试样本对于每个组的先验概率,计算每个组对应的类别的得分;
分类单元,所述分类单元用于将所有类别中得分最高的类别确定为所述测试样本的类别。
2.根据权利要求1所述的装置,其中,所述第二计算单元包括:
第四计算单元,所述第四计算单元用于使用高斯分布计算每个组的均值向量和协方差矩阵;
第五计算单元,所述第五计算单元用于根据每个组的均值向量和协方差矩阵,计算所述测试样本对于每个组的先验概率。
3.根据权利要求1所述的装置,其中,所述装置还包括:
设定单元,所述设定单元用于设定K的取值,其中,当根据当前的K值计算出的所有类别的得分中的最高得分与第二高得分之比小于预定阈值时,所述设定单元将当前的K值加上预定的步长,所述K值的初始值为预定范围的最小值;
所述分类单元用于当根据当前的K值计算出的所有类别的得分中的最高得分与第二高得分之比大于或等于所述预定阈值时,将所有类别中得分最高的类别确定为所述测试样本的类别。
4.根据权利要求3所述的装置,其中,
所述分类单元还用于在当前的K值大于或等于所述预定范围的最大值、且当根据当前的K值计算出的所有类别的得分中的最高得分与第二高得分之比小于所述预定阈值的情况下,将所述测试样本的类别确定为:根据当前的K值以及之前的K值 分别计算出的所有类别的得分中最高得分与第二高得分之比最大时具有所述最高得分的类别。
5.根据权利要求1所述的装置,其中,
所述分类单元还用于当所述分组单元确定所述K个最近邻样本属于同一个类别时,将所述K个最近邻样本属于的所述类别确定为所述测试样本的类别。
6.根据权利要求1所述的装置,其中,
所述第三计算单元用于将每个组的权重与所述测试样本对于每个组的先验概率的乘积、或者每个组的权重与所述测试样本对于每个组的先验概率之和、或者每个组的权重与所述测试样本对于每个组的先验概率的加权和,作为每个组对应的类别的得分。
7.一种最近邻分类方法,包括:
获得测试样本的K个最近邻样本,K为正整数;
根据所述K个最近邻样本的类别进行分组,其中,每个组对应于每个类别;
计算每个组的权重;
计算每个组的概率密度分布,并根据每个组的概率密度分布计算所述测试样本对于每个组的先验概率;
根据每个组的权重和所述测试样本对于每个组的先验概率,计算每个组对应的类别的得分;
将所有类别中得分最高的类别确定为所述测试样本的类别。
8.根据权利要求7所述的方法,其中,所述计算每个组的概率密度分布,并根据每个组的概率密度分布计算所述测试样本对于每个组的先验概率,包括:
使用高斯分布计算每个组的均值向量和协方差矩阵;
根据每个组的均值向量和协方差矩阵,计算所述测试样本对于每个组的先验概率。
9.根据权利要求7所述的方法,其中,所述方法还包括:
设定K的取值,其中,当根据当前的K值计算出的所有类别的得分中的最高得分与第二高得分之比小于预定阈值时,所述设定单元将当前的K值加上预定的步长,所述K值的初始值为预定范围的最小值;
所述将所有类别中得分最高的类别确定为所述测试样本的类别,包括:当根据当 前的K值计算出的所有类别的得分中的最高得分与第二高得分之比大于或等于所述预定阈值时,将所有类别中得分最高的类别确定为所述测试样本的类别。
10.根据权利要求9所述的方法,其中,所述方法还包括:
在当前的K值大于或等于所述预定范围的最大值、且根据当前的K值计算出的所有类别的得分中的最高得分与第二高得分之比小于所述预定阈值的情况下,将所述测试样本的类别确定为:根据当前的K值以及之前的K值分别计算出的所有类别的得分中最高得分与第二高得分之比最大时具有所述最高得分的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510711255.3/1.html,转载请声明来源钻瓜专利网。





