[发明专利]一种离散值特征向量的快速监督学习方法与分类系统在审
| 申请号: | 201380003066.X | 申请日: | 2013-05-12 | 
| 公开(公告)号: | CN103858135A | 公开(公告)日: | 2014-06-11 | 
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 黄勃 | 
| 主分类号: | G06K9/66 | 分类号: | G06K9/66;G06K9/62 | 
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 | 
| 地址: | 518112 广东省深圳市布*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 离散 特征向量 快速 监督 学习方法 分类 系统 | ||
技术领域
本发明涉及一种模式分类方法与系统,尤其是一种离散值特征向量的快速监督学习方法与分类系统。
背景技术
模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种。
其中监督学习分为2个阶段:
1模型构造阶段
A假定每个元组/样本都属于某个预定义的类,这些类由分类标号属性所定义
B用来构造模型的元组/样本集被称为训练集(training set)
C模型一般表示为:分类规则,决策树或者数学公式
2模型使用阶段:
估计模型的准确性
A用一些已知分类标号的测试集和由模型进行分类的结果进行比较
B两个结果相同所占的比率称为准确率
C测试集和训练集必须不相关。
现有的很多应用中,由于模式分类算法的时间复杂度较高,监督学习的测试阶段耗时太多,影响了模式分类的广泛应用。。
发明内容
本发明的目的在于提出一种离散值特征向量的快速监督学习方法与分类系统,其能解决在模式分类中,监督学习的测试阶段耗时太多的问题。
为了达到上述目的,本发明实施例是这样实现的:
一种离散值特征向量的快速监督学习方法,其特征在于包括以下步骤:
第一步,为训练向量集合构建一个超立方体的数据结构;
第二步,用模式分类方法为超立方体的每个单元值赋值;
第三步,测试向量通过查找超立方体的对应单元值分类。
其中,所述训练向量集合的每个训练向量,为m维向量,其中每一维取值范围长度为Ri,i= 1,2,…,m,所述超立方体的尺寸为R1*R2*…*Rm,超立方体的每一个索引值为向量对应的每一维的特征值,超立方体的每个单元值为对应向量的类别值。
优选的,第二步中的模式分类方法包括以下步骤:
第1步,为训练向量集合的每个训练向量对应的超立方体中的每个单元赋值;
第2步,如果超立方体中没有赋值的单元数量为0,则结束,否则执行第3步;
第3步,寻找下一个没有赋值的单元,计算其超立方体邻域中的已有赋值单元的每个类别的单元数量;
第4步,对这个没有赋值的单元,如果该邻域中已有赋值单元的数量不为0,执行第5步,如果该邻域中已有赋值单元的数量为0,执行第3步;
第5步,该没有赋值的单元的单元值为最多单元数量的类别值,并执行第2步。
本发明实施例的另一目的在于提供一种离散值特征向量的快速监督学习分类系统,其特征在于包括:
超立方体构建模块,用于为训练向量集合构建一个超立方体的数据结构;
超立方体赋值模块,用于利用模式分类方法为超立方体的每个单元值赋值;
测试向量分类模块,用于将测试向量通过查找超立方体的对应单元值分类。
其中,所述训练向量集合的每个训练向量,为m维向量,其中每一维取值范围长度为Ri,i= 1,2,…,m,所述超立方体的尺寸为R1*R2*…*Rm,超立方体的每一个索引值为向量对应的每一维的特征值,超立方体的每个单元值为对应向量的类别值。
优选的,所述超立方体赋值模块包括:
训练向量赋值模块,用于为训练向量集合的每个训练向量对应的超立方体中的每个单元赋值;
赋值单元数量判断模块,用于判断超立方体中没有赋值的单元数量,如果超立方体中没有赋值的单元数量为0,则跳转到结束模块,否则跳转到查找计算模块;
查找计算模块,用于寻找下一个没有赋值的单元,并计算其超立方体邻域中的已有赋值单元的每个类别的单元数量;
邻域判断模块,用于对这个没有赋值的单元进行该邻域中已有赋值单元的数量的判断,如果该邻域中已有赋值单元的数量不为0,则跳转到单元赋值模块,如果该邻域中已有赋值单元的数量为0,则跳转到查找计算模块;
单元赋值模块,用于对没有赋值的单元进行赋值,该没有赋值的单元的单元值为邻域中已有赋值单元中最多单元数量的类别值,并跳转到赋值单元数量判断模块;
结束模块,用于结束整个分类系统的运行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄勃,未经黄勃许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380003066.X/2.html,转载请声明来源钻瓜专利网。





