[发明专利]一种基于有效值存储及运算方式的关联规则挖掘方法有效
申请号: | 201910624715.7 | 申请日: | 2019-07-11 |
公开(公告)号: | CN110489411B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 任晓强;李梦男 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250353 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 有效值 存储 运算 方式 关联 规则 挖掘 方法 | ||
1.一种基于有效值存储及运算方式的关联规则挖掘方法,其特征在于,该方法用于发现超市交易等大数据集中数据之间有趣的关联;步骤如下:
S1、基于有效值的集合存储:设置存储集合,存储集合仅存储频繁单项所在事物的索引位置,即有效值1的位置值;具体步骤如下:
S101、扫描一遍事务数据库,对于事务集中的每一个频繁单项,设置一个存储集合;
S102、存储集合存储频繁单项在事务中出现的索引位置,即有效值1的位置值;
S2、基于有效值存储结构的连接操作:对两个存储集合进行连接操作生成候选项集;具体步骤如下:
S201、查找频繁单项集合:数据库生成的存储集合后,根据存储集合的支持度是否达到最小支持度找出频繁单项集合;
S202、对两个存储集合进行取交集得到存储两项集的新集合:对频繁单项集合执行连接操作,即对存储单项集的存储集合执行取交集操作,得到存储两项集的新集合;
S203、生产频繁项集:将步骤S1中生成的存储集合进行连接操作,得到两项集,通过最小支持度来判断两项集是否为频繁项集,并依次迭代生产频繁多项集:
①、若是,则依次进行迭代操作,即重复执行步骤S203,直至找不到频繁项集为止;
其中,对两个存储集合进行连接操作选取候选项集的原理为:对集合Aarr和集合Barr执行取交集操作,设集合Aarr和集合Barr均为有序排列,具体算法如下:
(1)、设遍历集合Aarr的索引值m为0,遍历集合Barr的索引值n为0;
(2)、判断Aarr.get(m)与Barr.get(n)的大小关系:
①、若Aarr .get(m)大于Barr.get (n),则跳转至步骤(3);
②、若Aarr .get(m)小于Barr.get (n),则跳转至步骤(4);
③、若Aarr .get(m)等于Barr.get (n),则跳转至步骤(5);
(3)、令n等于n+1,判断n值是否超过集合Barr中元素的数目:
①、若是,则跳转至步骤(6);
②、若否,则跳转至步骤(2);
(4)、令m等于m+1,判断m值是否超过集合Aarr中元素的数目:
①、若是,则跳转至步骤(6);
②、若否,则跳转至步骤(2);
(5)、将n在集合Barr中对应的值或m在集合Aarr对应的值添加到候选项集Sarr中,同时令n等于n+1,m等于m+1,判断m、n值中是否有超过其对应集合中元素的数目:
①、若是,则跳转至步骤(6);
②、若否,则跳转值步骤(2);
(6)、运算结束,得到候选项集Sarr的大小即为候选项集的支持度计数;
存储集合是按字典顺序进行排序,可知:
当 Aarr.get(m)小于 Barr.get (n)时,按照字典顺序Barr.get (n)后面的数均大于Aarr.get(m),故Barr(n)之后不会存在与Aarr.get(m)相同的值,Aarr.get(m)无需再与Barr.get (n)后面的值进行比较,进而令m+1,Aarr.get(m+1)继续与Barr.get (n)后面的值比较大小即可;
根据对两个存储集合进行连接操作选取候选项集的原理完成所述步骤S2中基于有效值存储结构的连接操作的具体步骤如下:
(一)、计算集合Aarr与Barr的交集,判断两个集合是否存在相同的位置值:
①、若集合Aarr与集合Barr的交集候选项集Sarr为空,则表示集合Aarr与集合Barr不存在相同的位置值,无法组合产生新的候选项集;
②、若候选项集Sarr不为空,则下一步执行步骤(二);
(二)、计算候选项集Sarr的大小,用得到候选项集Sarr的值再除以事务总数,即为候选项集Sarr的支持度;
(三)、根据候选项集Sarr的支持度和最小支持度判断该候选项集Sarr对应的项集是否为频繁项集:
①、若是,则保留用作下一次连接过程,下一步跳转至步骤(一),直至从候选项集中查找不到频繁项集;
②、若否,则将该候选项集Sarr删除,以节约存储空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910624715.7/1.html,转载请声明来源钻瓜专利网。