[发明专利]一种基于三支决策的分类器构建方法在审
申请号: | 201611170422.9 | 申请日: | 2016-12-16 |
公开(公告)号: | CN106599924A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 张涛;李林 | 申请(专利权)人: | 北京灵众博通科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京远创理想知识产权代理事务所(普通合伙)11513 | 代理人: | 卫安乐 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策 分类 构建 方法 | ||
技术领域
本发明涉及一种分类器构建方法,特别是关于一种基于三支决策的分类器构建方法。
背景技术
三支决策将传统的正域和负域二支决策语义拓展为正域、边界域、负域的三支决策语义,认为在数据信息不充分和获取数据信息代价较高额情况下,边界域决策(延迟决策)是一类可行的决策形式。
经典的分类器,都是二支分类器,只考虑接受或者拒绝两种情况,非此即彼,当信息充分时,二支分类器有很好的分类效果,但在实际应用中,信息常常缺乏精确性和完整性,因此二支分类器就会有较高的误分率。虽然目前有研究将传统二支分类器结合三支决策的思想进行改进,但本质上仍然以二支决策分类器为基础,仍无法克服信息缺乏精确性、完整性及精确度的问题。
发明内容
针对上述问题,本发明的目的是提供一种基于三支决策的分类器构建方法,该方法具有较好的可解释性,在信息不足或者不完备时,不会硬性的做出判断,而是做出第三种选择,即不承诺。
为实现上述目的,本发明采取以下技术方案:一种基于三支决策的分类器构建方法,其特征在于包括以下步骤:1)设论域U={x1,...xn,...,xN},xn是其中的某一对象,A={a1,...,ad,...,aD}是对象的D维特征集合,设V={V1,...,Vd,...,VD}为对象xn特征集合A的数值集合,其中为xn的特征ad的值,设集合类别X={X1,...,Xk,...,XK},表示对象类别;2)将高维数据降维映射到二维平面,降维映射后,每一个数列就表示一个特征,判断区间也变为一维;3)对于某一测试数据,以该测试数据在各特征上的数值为中心,选取长度r为判断半径;4)对于一条待测数据对象xn,其特征ad的值为在特征ad上若以为中心,以长度r为半径,划分判断区间Rd;5)分别计算该判断区间内属于不同类别的样本的数目ck,0≤ck≤B,得到在特征ad上该数据属于某一类别Xk的概率;6)根据概率判断测试数据类别,完成分类。
进一步,所述步骤4)中,判断区间
进一步,所述步骤4)中,判断区间半径r的选取过程如下:4.1)将测试数据归一化后,全部特征的数值都分布在区间[0,1]上,根据实际需求的预设精度,首 先将半径r的初始值rsta设定为0,步进rstp为0.01个单位,最大rend为1;4.2)经步骤4.1)计算后,选出分类最高精度P1,并且得到该精度下的r值:r=n1·0.01,式中,1≤n1≤100;此时有:n1·0.01≥(n1-1)·0.01,且n1·0.01≥(n1+1)·0.01;4.3)重设初始值rsta值和最大rend:
4.4)经步骤4.3)计算后,得出分类最高精度P2,如果有P2>P1,则此时:
r=(n1-1)·0.01+n2·0.001;4.5)根据上述步骤进行迭代,直至Pi+1≤Pi结束,得到最高分类精度Pi和此时半径:
进一步,所述步骤5)中,在特征ad上该数据属于某一类别Xk的概率为:
式中,B为判断区间内所有类别样本总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京灵众博通科技有限公司,未经北京灵众博通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611170422.9/2.html,转载请声明来源钻瓜专利网。