[发明专利]一种基于深度剪枝策略的关联规则挖掘方法有效

申请号：	201710170549.9	申请日：	2017-03-21
公开（公告）号：	CN106991141B	公开（公告）日：	2020-12-11
发明（设计）人：	李蕾;陈道新;李琪;吴亚彬	申请（专利权）人：	北京邮电大学;首都信息发展股份有限公司
主分类号：	G06F16/2458	分类号：	G06F16/2458
代理公司：	北京永创新实专利事务所 11121	代理人：	祗志洁
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明是一种基于深度剪枝策略的关联规则挖掘方法，用于对大数据集进行关联规则挖掘。本方法借鉴了基于压缩矩阵的Apriori算法的思想，对1‑频繁项集并不按照支持度计数进行排序，而是直接按照值大小对布尔矩阵内的向量进行排序，以确定之后的频繁项集连接的相对顺序；对k‑频繁项集根据事务长度进行压缩，删掉长度小于k的事务；根据项跟位置关系对k‑频繁项集进行剪枝，对于首项为I的k‑频繁项集的前k‑1项，位置在i的项出现的次数必须大于等于k‑i。本发明相对于MTCA算法，处理时间要短很多，并且在支持度较低的情况下比Apriori标准方法节约大量的时间，从大数据集获取关联规则的效率更高。
搜索关键词：	一种基于深度剪枝策略关联规则挖掘方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于深度剪枝策略的关联规则挖掘方法，其特征在于，包括：将事务数据库扫描成布尔矩阵，并生成1‑频繁项集的布尔矩阵M1，M1中的每一列和每一行，都按照值从小到大的顺序进行排列，通过排序确定频繁项集连接的相对顺序；生成(k+1)‑频繁项集及对应的布尔矩阵，k≥1；当k≥3时，每次生成(k+1)‑频繁项集时，先根据项跟位置关系对k‑频繁项集进行剪枝，再生成(k+1)‑频繁项集；所述的根据项跟位置关系是指：(1)统计首项为I的k‑频繁项集的数目，数目必须大于等于k，(2)对首项为I的k‑频繁项集的前k‑1项，设i代表首项为I的k‑频繁项集中的位置，位置在i的项出现的次数必须大于等于k‑i，i从0开始计数，且k‑i>0；所述的根据项跟位置关系对k‑频繁项集进行剪枝，是指将不符合所述项跟位置关系的k‑频繁项集删除；当(k+1)‑频繁项集的数目小于k+1，则停止查找，否则更新k值，继续生成(k+1)‑频繁项集。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学;首都信息发展股份有限公司，未经北京邮电大学;首都信息发展股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710170549.9/，转载请声明来源钻瓜专利网。

上一篇：一种监控信息表审核方法及系统
下一篇：一种基于微信数据和兴趣点数据识别城市功能区的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度剪枝策略的关联规则挖掘方法有效

专利文献下载