[发明专利]多层次分类方法有效
申请号: | 201010621985.1 | 申请日: | 2010-12-30 |
公开(公告)号: | CN102135981A | 公开(公告)日: | 2011-07-27 |
发明(设计)人: | 张金坚;陈文华;陈正刚;陈炯年;何明志;戴浩志;吴明勋;巫信融 | 申请(专利权)人: | 安克生医股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周长兴 |
地址: | 中国台湾台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多层次 分类 方法 | ||
技术领域
本发明是关于一种多层次分类方法,尤其指一种适用于建立一种多层判别分析模型,以及决定属性选择和切点的分类方法。
背景技术
分类方法的用途非常广泛,举例来说,在金融业上,银行在审核信用卡用户时,能辨别此位申请人是否会容易变成呆帐;在医药学理上,能判断细胞组织为正常或异常;在营销的研究上,能判断此种营销方法能否吸引顾客购买商品。因此,在数据探勘的领域里,占有及重要的部分即是在探讨分类方法。
分类方法是一种监督式学习(supervised learning)的方法,所谓的监督式学习方法是在知道目标输出值的情形下来进行数据探勘,反之则称为非监督式学习(unsupervised learning),如主成分分析(Principal component analysis)即为一种非监督式学习的方法。在分类方法里,一般需要选择适当的属性(attribute)来建立分类模型,例如,用身高和体重来判断这个人是男生或是女生,身高及体重即称为属性。建立分类模型时也往往会先把数据分成两群,一群为训练样本(training samples),另一群为独立测试样本(independent test samples),并使用训练样本来建立一个分类模型,独立测试样本则是用来验证此分类模型是否稳健。
目前,以两种现有的分类方法较为常见,分别为在多变量统计分析中常见的费雪线性判别分析(Fisher linear discriminant Analysis,FLD),以及分类与回归树(Classification and regression trees,CART)。然而,本案发明人发现,在基于前述分类方法中,尤其在属性的选择上,部分属性只能判别特定类别而影响其分类应用的准确性;且在以往分类模型的建立上,会因其属性的选择不同,或未对所欲分类的判别分析模型进行效能的评估,进而影响分类的准确性。
因此,目前亟需一种新的多层次分类方法以解决上述问题。
发明内容
本发明的目的在于提供一种多层次分类方法,由多层判别分析模型,在每一层会寻找一或两个切点来对一或两个类别做出分类,且每一层可以同时使用多个属性,并通过费雪判别分析来找到这些属性的最佳线性组合。
本发明的又一目在于提供一种用以分类多个影像样本的计算机可纪录媒体,以建立一多层次分类方法对此些影像样本进行分类。
为实现上述目的,本发明提供的多层次分类方法,是于一计算机可纪录媒体中用以分类多个影像样本,该计算机可纪录媒体包括有一处理器、一输入装置、及一储存装置,该方法至少包括下列步骤:
(a)接收复数个原始样本;
(b)提供复数个属性,并以一多变量参数对该些原始样本由该些属性进行显著性评估计算;
(c)选择至少一切点并建立一判别分析模型,将该步骤(b)中评估后具有显著性者其中之一,提供一变量同质分析参数筛选出该至少一切点,将该些属性评估后具有显著性者中所包含的该复数个原始样本分群为至少一类别以建立该判别分析模型,其中该至少一类别包括有第一类别(NodeA)、第二类别(NodeB)及未决定的第三类别(NodeN);
(d)进行一评估模型效能的步骤,将该判别分析模型中加入该些属性进行显著性评估;其中,当加入该至少一属性后有增进该判别分析模型的显著性时,便进入该判别分析模型的下一层,再以该变量同质分析参数筛选出至少一切点,将该判别分析模型中加入该些属性评估后具有显著性者中所包含的该复数个原始样本继续分群为第一类别(NodeA)、第二类别(NodeB)及未决定的第三类别(NodeN);以及
(e)加入一停止条件,该停止条件是以选择该变量同质分析参数,若不拒绝虚无假设,该判别分析模型即停止往下一层分群;或在该评估模型效能的步骤中加入该些属性以一回归分析法进行显著性评估,当加入该些属性后无法提升该判别分析模型的显著性时,若拒绝虚无假设,该判别分析模型即停止往下一层分群。
所述的多层次分类方法,其中,在加入该停止条件时,该判别分析模型的最后一层分类层中,该未决定的第三类别(NodeN)中所包含的样本数为零。
所述的多层次分类方法,其中,该多变量参数为Wilk’s lambda或Gini index。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安克生医股份有限公司,未经安克生医股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010621985.1/2.html,转载请声明来源钻瓜专利网。