[发明专利]基于历史分类器二次学习的数据流分类方法在审
申请号: | 201811599198.4 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109447188A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 刘若辰;张泽桐;焦李成;刘静;慕彩虹;张向荣 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类器 数据流分类 待分类数据 历史信息 存档 动态数据环境 分类结果 训练数据 学习 构建分类器 集成分类器 分类数据 用户输出 分类 构建 更新 纠正 | ||
1.一种基于历史分类器二次学习的数据流分类方法,其特征在于,包括如下步骤:
(1)获取训练数据和待分类数据:
接收动态数据环境下的数据流,并将数据流中的数据按照接收顺序划分为n个数据块,n≥3,将每个数据块中带有分类标签的数据作为训练数据,其余的数据作为待分类数据,记第t个数据块的训练数据为Dt,待分类数据为Tt,并将t初始化为1;
(2)获取分类器ft:
将训练数据Dt输入到回归树中对其进行训练,得到分类器ft;
(3)判断存档A中存入的分类器数量是否更新要求:
将分类器ft存入存档A中,并判断A内存入的分类器的数量是否小于m,2≤m<n,若是,令t=t+1,并执行步骤(2),否则,将t=m时存档A中的分类器放入存档St中,并执行步骤(4);
(4)对存档St中的分类器进行更新:
当t=m时,将训练数据Dt输入到回归树中对其进行训练,得到分类器ft,并将分类器ft存入存档St中,通过多样性函数求取St内存入的每个分类器相对其他分类器的多样性值的和divs,然后删除St内divs值最小的分类器,得到更新后的存档St;
(5)对训练数据Dt进行分类:
当t=m时,通过St内的分类器对训练数据Dt进行分类,得到分类结果Yt;
(6)对历史分类器进行二次学习,并构建分类器集成EMt:
(6a)当t=m时,计算训练数据Dt的新分类标签Yt′:Yt′=Yt-y,并用Yt′替换训练数据Dt的分类标签,得到数据集Dt′,然后将Dt′输入到回归树中对其进行训练,得到分类器Ft′,最后将Ft′与从存档St中读取的历史存入的分类器Ft的和作为分类器组Ft+Ft′,实现对历史分类器的二次学习;
(6b)当t=m时,按照下式对分类器ft与分类器组Ft+Ft′进行组合,得到分类器集成EMt:
EMt=(Ft+Ft′+ft)/(m+1);
(7)对待分类数据Tt进行分类:
当t=m时,将待分类数据Tt输入到集成EMt中进行分类,得到待分类数据Tt的分类结果;
(8)获取t=m+1以后的待分类数据Tt的分类结果:
令t=t+1,重复执行步骤(4)到步骤(7),直到当t>n停止,得到n-m个待分类数据的分类结果;
(9)向用户输出所有待分类数据的分类结果。
2.根据权利要求1所述的一种动态数据环境下的数据流分类方法,其特征在于,步骤(2)、步骤(4)和步骤(6a)中所述的回归树,采用CART树或Hoeffding树。
3.根据权利要求1所述的一种动态数据环境下的数据流分类方法,其特征在于,步骤(4)中所述的多样性函数,其表达式为:
其中,fi为存档St中第i个分类器,fj为存档St中第j个分类器,Q(fi,fj)为分类器距离函数:
其中,N11表示训练数据中分类器fi和分类器fj同时正确分类的数据的数量,N00表示训练数据中分类器fi和分类器fj同时错误分类的数据的数量,N01表示在训练数据中,分类器fi分类错误,但分类器fj分类正确的数据的数量,N10表示在训练数据中,分类器fi分类正确,但分类器fj分类错误的数据的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811599198.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电机故障诊断方法及系统
- 下一篇:读点定位自助证件存取设备及读点定位方法