[发明专利]一种基于改进的Apriori算法的电网数据挖掘方法在审
申请号: | 202210096059.X | 申请日: | 2022-01-26 |
公开(公告)号: | CN114547138A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 马永;周明;徐敏;张靖;张子健;王俊 | 申请(专利权)人: | 国网安徽省电力有限公司信息通信分公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q50/06 |
代理公司: | 合肥律众知识产权代理有限公司 34147 | 代理人: | 赵娟 |
地址: | 230000 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 apriori 算法 电网 数据 挖掘 方法 | ||
1.一种基于改进的Apriori算法的电网数据挖掘方法,通过限制候选产生发现频繁项集,再由频繁项集产生关联规则,假设全项集X={x1,x2,x3,...,xn},事务数据库D=(X1,X2,X3,...,Xm)包含m个事务,其中第i个事务Xi由k(k≥1)项x组成,即为k候选项集Ck={x1,x2,x3,...,xk},其特征在于,产生关联规则包括以下步骤:
步骤A1,扫描所有频繁项集L,并计算置信度、效率度、兴趣度,
置信度计算公式
效率度计算公式
兴趣度的计算公式
其中,A为前项集,B为后项集,表示A、B的关联规则,为的支持度,|*|表示集合*中所有事务的数量;
步骤A2,与置信度阈值比较,去除不满足条件的频繁项集,得到频繁项集L′;
步骤A3,与效率度阈值比较,去除不满足条件的频繁项集,得到频繁项集L″;
步骤A4,与效率度阈值比较,去除不满足条件的频繁项集,得到频繁项集L″′;
步骤A5:产生关联规则并输出。
2.根据权利要求1所述的基于改进的Apriori算法的电网数据挖掘方法,其特征在于,发现频繁项集包括以下步骤:
步骤B1,扫描事务数据库,计算k候选项集的支持度,根据支持度阈值确定频繁项集Lk;
步骤B2,计算频繁项集Lk中每项出现的次数,并记录出现次数小于k的项集M={ij(|Lk(ij)|<k)};
步骤B3,去除频繁项集Lk中所有含有项集M中元素的频繁项集,得到Lnewk;
步骤B4,根据频繁项集Lnewk,生成k+1候选项集Ck+1;
步骤B5,不断迭代,直到频繁项集为空。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网安徽省电力有限公司信息通信分公司,未经国网安徽省电力有限公司信息通信分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210096059.X/1.html,转载请声明来源钻瓜专利网。