[发明专利]一种基于三支决策的分类器构建方法在审

申请号：	201611170422.9	申请日：	2016-12-16
公开（公告）号：	CN106599924A	公开（公告）日：	2017-04-26
发明（设计）人：	张涛;李林	申请（专利权）人：	北京灵众博通科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京远创理想知识产权代理事务所(普通合伙)11513	代理人：	卫安乐
地址：	100000 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于决策分类构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种分类器构建方法，特别是关于一种基于三支决策的分类器构建方法。

背景技术

三支决策将传统的正域和负域二支决策语义拓展为正域、边界域、负域的三支决策语义，认为在数据信息不充分和获取数据信息代价较高额情况下，边界域决策(延迟决策)是一类可行的决策形式。

经典的分类器，都是二支分类器，只考虑接受或者拒绝两种情况，非此即彼，当信息充分时，二支分类器有很好的分类效果，但在实际应用中，信息常常缺乏精确性和完整性，因此二支分类器就会有较高的误分率。虽然目前有研究将传统二支分类器结合三支决策的思想进行改进，但本质上仍然以二支决策分类器为基础，仍无法克服信息缺乏精确性、完整性及精确度的问题。

发明内容

针对上述问题，本发明的目的是提供一种基于三支决策的分类器构建方法，该方法具有较好的可解释性，在信息不足或者不完备时，不会硬性的做出判断，而是做出第三种选择，即不承诺。

为实现上述目的，本发明采取以下技术方案：一种基于三支决策的分类器构建方法，其特征在于包括以下步骤：1)设论域U＝{x₁,...x_n,...,x_N}，x_n是其中的某一对象，A＝{a₁,...,a_d,...,a_D}是对象的D维特征集合，设V＝{V₁,...,V_d,...,V_D}为对象x_n特征集合A的数值集合，其中为x_n的特征a_d的值，设集合类别X＝{X₁,...,X_k,...,X_K}，表示对象类别；2)将高维数据降维映射到二维平面，降维映射后，每一个数列就表示一个特征，判断区间也变为一维；3)对于某一测试数据，以该测试数据在各特征上的数值为中心，选取长度r为判断半径；4)对于一条待测数据对象x_n，其特征a_d的值为在特征a_d上若以为中心，以长度r为半径，划分判断区间R_d；5)分别计算该判断区间内属于不同类别的样本的数目c_k，0≤c_k≤B，得到在特征a_d上该数据属于某一类别X_k的概率；6)根据概率判断测试数据类别，完成分类。

进一步，所述步骤4)中，判断区间

进一步，所述步骤4)中，判断区间半径r的选取过程如下：4.1)将测试数据归一化后，全部特征的数值都分布在区间[0,1]上，根据实际需求的预设精度，首先将半径r的初始值r_sta设定为0，步进r_stp为0.01个单位，最大r_end为1；4.2)经步骤4.1)计算后，选出分类最高精度P₁，并且得到该精度下的r值：r＝n₁·0.01，式中，1≤n₁≤100；此时有：n₁·0.01≥(n₁-1)·0.01，且n₁·0.01≥(n₁+1)·0.01；4.3)重设初始值r_sta值和最大r_end：

4.4)经步骤4.3)计算后，得出分类最高精度P₂，如果有P₂>P₁，则此时：

r＝(n₁-1)·0.01+n₂·0.001；4.5)根据上述步骤进行迭代，直至P_i+1≤P_i结束，得到最高分类精度P_i和此时半径：

进一步，所述步骤5)中，在特征a_d上该数据属于某一类别X_k的概率为：

式中，B为判断区间内所有类别样本总数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京灵众博通科技有限公司，未经北京灵众博通科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201611170422.9/2.html，转载请声明来源钻瓜专利网。

上一篇：一种对印防伪特征的检测方法及装置
下一篇：一种基于深度学习的植物叶片识别系统与方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于三支决策的分类器构建方法在审

专利文献下载