[发明专利]基于历史分类器二次学习的数据流分类方法在审

申请号：	201811599198.4	申请日：	2018-12-26
公开（公告）号：	CN109447188A	公开（公告）日：	2019-03-08
发明（设计）人：	刘若辰;张泽桐;焦李成;刘静;慕彩虹;张向荣	申请（专利权）人：	西安电子科技大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	陕西电子工业专利中心 61205	代理人：	陈宏社;王品华
地址：	710071 陕***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提出了一种基于历史分类器二次学习的数据流分类方法，旨在通过历史分类器的二次学习有效利用历史信息，提高动态数据环境下数据流分类的精度，包括如下步骤：获取训练数据和待分类数据；获取分类器；判断存档内存入的分类器数量是否满足要求；对存档中的分类器进行更新；对训练数据进行分类；对历史分类器进行二次学习，并构建分类器集成；对待分类数据进行分类；获取t＝m+1以后的待分类数据的分类结果；向用户输出待分类数据的分类结果。本发明在构建集成分类器时，通过对存档中历史存入的分类器进行二次学习，对历史信息进行纠正，从而有效的利用历史信息，提高动态数据环境下数据流分类的精度。
搜索关键词：	分类器数据流分类待分类数据历史信息存档动态数据环境分类结果训练数据学习构建分类器集成分类器分类数据用户输出分类构建更新纠正
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于历史分类器二次学习的数据流分类方法，其特征在于，包括如下步骤：(1)获取训练数据和待分类数据：接收动态数据环境下的数据流，并将数据流中的数据按照接收顺序划分为n个数据块，n≥3，将每个数据块中带有分类标签的数据作为训练数据，其余的数据作为待分类数据，记第t个数据块的训练数据为Dt，待分类数据为Tt，并将t初始化为1；(2)获取分类器ft：将训练数据Dt输入到回归树中对其进行训练，得到分类器ft；(3)判断存档A中存入的分类器数量是否更新要求：将分类器ft存入存档A中，并判断A内存入的分类器的数量是否小于m，2≤m＜n，若是，令t＝t+1，并执行步骤(2)，否则，将t＝m时存档A中的分类器放入存档St中，并执行步骤(4)；(4)对存档St中的分类器进行更新：当t＝m时，将训练数据Dt输入到回归树中对其进行训练，得到分类器ft，并将分类器ft存入存档St中，通过多样性函数求取St内存入的每个分类器相对其他分类器的多样性值的和divs，然后删除St内divs值最小的分类器，得到更新后的存档St；(5)对训练数据Dt进行分类：当t＝m时，通过St内的分类器对训练数据Dt进行分类，得到分类结果Yt；(6)对历史分类器进行二次学习，并构建分类器集成EMt：(6a)当t＝m时，计算训练数据Dt的新分类标签Yt′：Yt′＝Yt‑y，并用Yt′替换训练数据Dt的分类标签，得到数据集Dt′，然后将Dt′输入到回归树中对其进行训练，得到分类器Ft′，最后将Ft′与从存档St中读取的历史存入的分类器Ft的和作为分类器组Ft+Ft′，实现对历史分类器的二次学习；(6b)当t＝m时，按照下式对分类器ft与分类器组Ft+Ft′进行组合，得到分类器集成EMt：EMt＝(Ft+Ft′+ft)/(m+1)；(7)对待分类数据Tt进行分类：当t＝m时，将待分类数据Tt输入到集成EMt中进行分类，得到待分类数据Tt的分类结果；(8)获取t＝m+1以后的待分类数据Tt的分类结果：令t＝t+1，重复执行步骤(4)到步骤(7)，直到当t＞n停止，得到n‑m个待分类数据的分类结果；(9)向用户输出所有待分类数据的分类结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安电子科技大学，未经西安电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811599198.4/，转载请声明来源钻瓜专利网。

上一篇：电机故障诊断方法及系统
下一篇：读点定位自助证件存取设备及读点定位方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于历史分类器二次学习的数据流分类方法在审

专利文献下载