[发明专利]基于MapReduce的并行频繁项集挖掘方法有效
| 申请号: | 202010107067.0 | 申请日: | 2020-02-20 |
| 公开(公告)号: | CN111309786B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 毛伊敏;张弛 | 申请(专利权)人: | 韶关学院 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N5/025 |
| 代理公司: | 重庆天成卓越专利代理事务所(普通合伙) 50240 | 代理人: | 路宁 |
| 地址: | 512023 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提出了一种基于MapReduce的并行频繁项集挖掘方法,包括以下步骤:S1:输入待挖掘的数据集,并对数据集进行划分分区和筛选,得到频繁1项集,对频繁1项集中各个项排列生成F‑list;S2:通过负载均衡策略LBSBDG对F‑list均匀分组;估算F‑list中每一项的负载量,并根据每一项的负载量进行均匀分组,生成分组列表G‑list;S3:启动频繁k项挖掘任务,并行挖掘待挖掘的数据集中所有的频繁项集。本发明采用DiffNodeset数据结构,能够有效避免算法中存在的N‑list基数过大的问题;通过双向比较策略T‑wcs加快2项集的生成效率,以降低算法的时间复杂度。 | ||
| 搜索关键词: | 基于 mapreduce 并行 频繁 挖掘 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韶关学院,未经韶关学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010107067.0/,转载请声明来源钻瓜专利网。





