[发明专利]基于平均测试代价的一维尺度决策树构造算法在审
申请号: | 201610284638.1 | 申请日: | 2016-04-29 |
公开(公告)号: | CN106611179A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 金平艳;胡成华 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 平均 测试 代价 尺度 决策树 构造 算法 | ||
1.基于平均测试代价的一维尺度决策树构造算法,该算法涉及涉及智能服务、机器学习领域,其特征是:该算法的具体实施方案如下:通过原训练示例利用EP准则得到新背景训练集,在每项测试成本、经济因子和完整阔值已知的情况下,综合考虑和的值依次选择属性结点,再利用分裂抽象属性的完整因子与给定作比较,来得到相应的分支,在决策树生成过程中,如遇到在一个子集或分支结点中的所有样例都属于相同类别或是在一个子集或分支结点中没有待分裂的候选抽象属性,即基于平均测试代价的一维尺度决策树模型生成。
2.根据权利要求1所述的基于平均测试代价的一维尺度决策树构造算法,其特征是:该算法的具体实施步骤如下:
步骤1:定义L为类的种类,其中数为n,Li表示第i类,上述:根据EP结点类的分类准则得到新背景训练样本集ISA
步骤2:专家根据实际情况,给出每项属性进行的测试成本;
步骤3:用户自定义参数经济因子w和完整阔值ct,它们的范围都是[0,1];
步骤4:根据信息增益与ICF(信息成本函数)遍历输入的新背景训练样本集的候选属性列表,计算每个候选属性,得出当前选择属性;
步骤4.1 :遍历所有ISA新背景训练样本集的属性,计算每个属性的ICF,并选择ICF值最小的属性作为平均测试代价的一维尺度决策树的根结点;
步骤5:依据ISA层次结构归纳准则和抽象值的完整因子c与完整因子阔值的大小ct比较结果,作为基于测试代价的一维尺度决策树的扩展结点;
步骤6:根据最优分裂属性选择因子ct候选的抽象属性得到相应的每一个属性和观测值,在结点下生成相应的分支;每个分支的样本集合为所有观测值等于对应分支的新背景训练属性样本,这样的属性集合个数为I;
步骤7:依次为每个抽象分裂属性的每个属性值产生一个分支类,得到相应于该分支属性值的子集,对各子集递归调用本算法,即重回步骤4.1,用同样的方法将样本子集分割,产生分支的分支,同时获得相应子集的子集,直到满足以下两条件之一则终止建树过程,即:
条件1:在一个子集或分支结点中所有样例属性都为同一抽象属性类别,又称之为观测值;
条件2:在一个子集或分支结点中分裂属性为抽象属性的集合为空。
3.根据权利要求2所述的基于平均测试代价的一维尺度决策树构造算法,其特征是: 所述步骤1中对于多类标号的原数据集都可以转化为两类情况,基于结点的归纳准则得出层次结构为:
其中ISA为新的背景样本抽象属性,记为,为正例个数,为反例个数,抽象属性,如性别中男女;根据类的种类分类规则得到新的训练样本集,即为ISA背景训练样本集;新背景训练样本集叶子结点发生了变化。
4.根据权利要求2所述的基于平均测试代价的一维尺度决策树构造算法,其特征是: 所述步骤4中,候选属性的属性选择因子为:
其中为总的数据信息,为不可取数据信息;
这里为属性i信息增量,w为检验经济标准一个变量,costi为属性i的测试成本,costi+1>1,当cost=0时,f(cost)有意义:ICF是信息成本函数,用来表征每一属性的选择。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610284638.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:晶体中心位置图生成方法
- 下一篇:基于测试代价的决策树分类器构造方法