[发明专利]一种基于分类器多样性和Mcdiarmid不等式的概念漂移检测方法在审
| 申请号: | 202010452367.2 | 申请日: | 2020-05-25 |
| 公开(公告)号: | CN111639694A | 公开(公告)日: | 2020-09-08 |
| 发明(设计)人: | 赵蕴龙;夏源 | 申请(专利权)人: | 南京航空航天大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/18 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 211106 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 分类 多样性 mcdiarmid 不等式 概念 漂移 检测 方法 | ||
1.一种基于分类器多样性和Mcdiarmid不等式的概念漂移检测方法,其特征是按如下步骤进行:
步骤一:增量训练两个分歧较大的个体分类器,并且对于新到来的数据流,监视这对分类器的多样性,计算它们之间预测结果的差异度量。
步骤二:设定滑动窗口h的大小为n,若滑动窗口h中内容未满,将最新数据流的差异度量结果自动加入到滑动窗口h中。若滑动窗口h中内容已满,将最初的差异度量结果移出滑动窗口,并将最新的结果加入滑动窗口。
步骤三:给定一个置信度,通过置信度和Mcdiarmid不等式理论求得判断漂移的阈值。
步骤四:滑动窗口中每个元素都与一个权重相关联,计算当前时刻的滑动窗口加权平均值与目前为止观察到的最大加权平均值的差值,并将差值和之前得到的阈值比较来判断是否发生漂移。
2.根据权利要求1所诉一种基于分类器多样性和Mcdiarmid不等式的概念漂移检测方法,其特征在于:所诉步骤一中,使数据流S表示为(X1,y1),(X2,y2),。。。,(Xt,yt)。(Xt,yt)代表着实例在t时到达。设当前两个异质增量分类器为u和v,两个分类器对于新到的实例Xt进行实时分类得到的结果分别为yu和yv。若yu的结果等于yv,则它们的差异度量值p取1,若yu的结果不等于yv,则它们的差异度量值p取0。
3.根据权利要求1所诉一种基于分类器多样性和Mcdiarmid不等式的概念漂移检测方法,其特征在于:所诉步骤二中,滑动窗口h的大小取n,若滑动窗口中的内容没有填满的时候,可以直接将当前时刻得到的差异度量值p填入滑动窗口中。若滑动窗口中的内容已满,这个时候将最一开始进入滑动窗口的差异度量值p移出,然后将之后的值p全部往前移动一位,最后将新得到的差异度量值p填入到滑动窗口的末尾处。
4.根据权利要求1所诉一种基于分类器多样性和Mcdiarmid不等式的概念漂移检测方法,其特征在于:所诉步骤三中,给定一个所能接受的置信度δ,并根据该置信度和Mcdiarmid不等式引入判断漂移的阈值ε。
Mcdiarmid不等式的定义如下:使得X1,X2,。。。,Xn是n个独立随机变量,如果一个函数f:Xn→R满足对所有的i都可以找到一个常数ci<∞,使得:
|f(X1,X2,...,Xi,...,Xn)-f(X1,X2,...,X′i,...,Xn)|≤ci (1)
上式(1)表明对于函数f来说,替换其中任意一个X值,函数值的变化不会超过常数ci。因此,对于任意ε>0,Mcdiarmid不等式给出了一个概率界,如公式(2)所示:
因此,给定一个置信度δ,使用公式(3)得到阈值ε:
其中wi表示为滑动窗口的加权值,给定一个规则wi<wi+1,这样可以使滑动窗口刚进来的元素权重高于之前进来的原来。wi=1+(i-1)d,d可以取值为0.01。
5.根据权利要求1所诉一种基于分类器多样性和Mcdiarmid不等式的概念漂移检测方法,其特征在于:所诉步骤四中,当前滑动窗口的加权平均值将当前的加权平均值μ与最大加权平均值μmax进行比较。如果Δμ=μmax-μ>ε。即判定当前数据流发生了概念漂移。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010452367.2/1.html,转载请声明来源钻瓜专利网。





