[发明专利]基于历史分类器二次学习的数据流分类方法在审
申请号: | 201811599198.4 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109447188A | 公开(公告)日: | 2019-03-08 |
发明(设计)人: | 刘若辰;张泽桐;焦李成;刘静;慕彩虹;张向荣 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于历史分类器二次学习的数据流分类方法,旨在通过历史分类器的二次学习有效利用历史信息,提高动态数据环境下数据流分类的精度,包括如下步骤:获取训练数据和待分类数据;获取分类器;判断存档内存入的分类器数量是否满足要求;对存档中的分类器进行更新;对训练数据进行分类;对历史分类器进行二次学习,并构建分类器集成;对待分类数据进行分类;获取t=m+1以后的待分类数据的分类结果;向用户输出待分类数据的分类结果。本发明在构建集成分类器时,通过对存档中历史存入的分类器进行二次学习,对历史信息进行纠正,从而有效的利用历史信息,提高动态数据环境下数据流分类的精度。 | ||
搜索关键词: | 分类器 数据流分类 待分类数据 历史信息 存档 动态数据环境 分类结果 训练数据 学习 构建分类器 集成分类器 分类数据 用户输出 分类 构建 更新 纠正 | ||
【主权项】:
1.一种基于历史分类器二次学习的数据流分类方法,其特征在于,包括如下步骤:(1)获取训练数据和待分类数据:接收动态数据环境下的数据流,并将数据流中的数据按照接收顺序划分为n个数据块,n≥3,将每个数据块中带有分类标签的数据作为训练数据,其余的数据作为待分类数据,记第t个数据块的训练数据为Dt,待分类数据为Tt,并将t初始化为1;(2)获取分类器ft:将训练数据Dt输入到回归树中对其进行训练,得到分类器ft;(3)判断存档A中存入的分类器数量是否更新要求:将分类器ft存入存档A中,并判断A内存入的分类器的数量是否小于m,2≤m<n,若是,令t=t+1,并执行步骤(2),否则,将t=m时存档A中的分类器放入存档St中,并执行步骤(4);(4)对存档St中的分类器进行更新:当t=m时,将训练数据Dt输入到回归树中对其进行训练,得到分类器ft,并将分类器ft存入存档St中,通过多样性函数求取St内存入的每个分类器相对其他分类器的多样性值的和divs,然后删除St内divs值最小的分类器,得到更新后的存档St;(5)对训练数据Dt进行分类:当t=m时,通过St内的分类器对训练数据Dt进行分类,得到分类结果Yt;(6)对历史分类器进行二次学习,并构建分类器集成EMt:(6a)当t=m时,计算训练数据Dt的新分类标签Yt′:Yt′=Yt‑y,并用Yt′替换训练数据Dt的分类标签,得到数据集Dt′,然后将Dt′输入到回归树中对其进行训练,得到分类器Ft′,最后将Ft′与从存档St中读取的历史存入的分类器Ft的和作为分类器组Ft+Ft′,实现对历史分类器的二次学习;(6b)当t=m时,按照下式对分类器ft与分类器组Ft+Ft′进行组合,得到分类器集成EMt:EMt=(Ft+Ft′+ft)/(m+1);(7)对待分类数据Tt进行分类:当t=m时,将待分类数据Tt输入到集成EMt中进行分类,得到待分类数据Tt的分类结果;(8)获取t=m+1以后的待分类数据Tt的分类结果:令t=t+1,重复执行步骤(4)到步骤(7),直到当t>n停止,得到n‑m个待分类数据的分类结果;(9)向用户输出所有待分类数据的分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811599198.4/,转载请声明来源钻瓜专利网。
- 上一篇:电机故障诊断方法及系统
- 下一篇:读点定位自助证件存取设备及读点定位方法