[发明专利]一种减少候选项集的数据流高效用项集挖掘算法在审
| 申请号: | 201611202991.7 | 申请日: | 2016-12-23 |
| 公开(公告)号: | CN106777182A | 公开(公告)日: | 2017-05-31 |
| 发明(设计)人: | 陈涛 | 申请(专利权)人: | 陕西理工学院 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
| 地址: | 723000 陕西*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了本发明提供的一种减少候选项集的数据流高效用项集挖掘算法,首先,通过数据流中当前窗口的一次扫描建立一个全局树,并降低全局树中头表入口与节点的冗余效用值;然后,基于全局树生成候选模式,基于增长算法降低局部树的候选项集效用;在候选项集效用中,按照事务集的顺序,依次将第k个事务中的ij项的事务加权效用相加,作为节点ij项的事物加权效用总和,处理次频效用项集,将次频效用项加入到树中;然后通过引入高事务效用阈值与低事务效用阈值,PTUVD存放数据集中的次频效用项集;最后计算实际效用来确定最终的高效用项集。基于真实数据流的实验结果表明,本发明的时空效率与内存占用比均优于其他数据流的高效用模式挖掘算法。 | ||
| 搜索关键词: | 一种 减少 候选 数据流 高效 用项 挖掘 算法 | ||
【主权项】:
一种减少候选项集的数据流高效用项集挖掘算法,其特征在于,包括如下步骤:S1、首先,通过数据流中当前窗口的一次扫描建立一个全局树,并降低全局树中头表入口与节点的冗余效用值;S2、然后,基于全局树生成候选模式,基于增长算法降低局部树的候选项集效用;S3、在候选项集效用中,按照事务集的顺序,依次将第 k 个事务中的ij项的事务加权效用相加,作为节点ij项的事物加权效用总和,同时,将项ij的前缀项加入到节点 ij的前缀项集链表中, 处理次频效用项集,将次频效用项加入到树中;S4、然后通过引入高事务效用阈值与低事务效用阈值,将事务加权效用率划分为三层,在原始事务集和新增事务集中分层对应处理,利用HTWUD存放数据集中的高频效用项集,PTUVD存放数据集中的次频效用项集;S5、最后计算实际效用来确定最终的高效用项集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西理工学院,未经陕西理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611202991.7/,转载请声明来源钻瓜专利网。





