[发明专利]一种应用于购买模式下的高效用周期频繁模式挖掘的方法有效

专利信息
申请号: 202211463101.3 申请日: 2022-11-22
公开(公告)号: CN115563192B 公开(公告)日: 2023-03-10
发明(设计)人: 张振洲;陈建铭;吴明泰;吴祖扬 申请(专利权)人: 山东科技大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06Q40/04
代理公司: 青岛智地领创专利代理有限公司 37252 代理人: 陈海滨
地址: 266590 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 应用于 购买 模式 效用 周期 频繁 挖掘 方法
【说明书】:

发明提供一种应用于购买模式下的高效用周期频繁模式挖掘的方法,包括如下步骤:S1,输入数据库和五个自定义阈值;S2,扫描数据库构建1项集x的HUPFPS‑list,并判断其是否为高效用周期频繁模式;S3,根据上界值对搜索空间进行修剪,将符合条件的HUPFPS‑list添加到集合中;S4,将修剪后的1项集相交合并成2项集,并判断2项集是否为HUPFPS;S5,递归循环n‑1项集的HUPFPS‑list生成n项集,直至不能扩展,则输出所有高效用周期频繁项集。本发明的技术方案克服现有技术中大多数关于周期模式的研究都是在单个序列中挖掘,并且没有考虑模式的内部效用和外部效用的问题。

技术领域

本发明涉及数据挖掘的技术领域,具体涉及一种应用于购买模式下的高效用周期频繁模式挖掘的方法。

背景技术

近年来高效用周期模式挖掘渐渐成为数据挖掘方向中的一个热门方向,针对周期模式挖掘已经有许多学者做了充分的研究。但是先前的周期模式挖掘算法都是针对单个时间序列进行挖掘,并且对于周期性模式的挖掘忽略了数据内在的权重(价值)和量化信息,导致挖掘的模式不能在利润或者效益上获得优势。为了迎合大众对效益的需求,与效益相关联的高效用模式挖掘(High-Utility Pattern Mining,HUPM)已经成为数据智能领域学术界以及工业界的研究重点之一。在效用模式挖掘研究中,模式在某条数据/记录中可以出现不止一次,而且可以对模式本身的价值设置比重,更符合现实社会的应用需要。随着周期模式的不断深入研究,一些周期性模式的变体考虑了模式的效用(利润)。随后,人们又设计了一种名为PHUSPM的算法挖掘多个符号序列中的高效用周期模式,该算法将多个序列当作一个序列,利用相同的周期度量挖掘单个序列中的周期模式。

近些年来,序列模式挖掘成为最流行的模式挖掘任务之一,序列模式挖掘作为频繁项集挖掘问题的推广,目的是在序列中发现频繁的子序列。目前,虽然提出了很多SPM算法应用到实际中,但SPM算法有一些局限性,这些算法没有考虑顺序中项目的数量及其单位利润,他们不能用于发现数据中经常出现的高效用模式。这些因素在领域中更加具有应用价值,例如顾客买啤酒和炸鸡,然后是牛肉,这种购买的模式可能会产生很高的利润,但牛肉在总利润中占比更大,在实际应用中找到多个客户每周定期购买的利润高的模式更重要。在传统的周期频繁模式挖掘PFPM中,有一些物品会被客户定期购买,但是无法发现经常被购买的物品哪些利润占比更高,这极大地阻碍了它们对一些实际应用程序的有效性,比如产品的组合推荐。另一个例子是某些DNA分子在基因序列中定期的出现,但是每个DNA分子的重要程度不同,这直接影响到一些外部性状的表达,找出频繁出现且起到主要作用的DNA分子是最关键的。大多数关于周期模式的研究都是在单个序列中挖掘,并且没有考虑模式的内部效用和外部效用,因此,现需要一种能够在多序列中挖掘、并且考虑内部效用和外部效用的高效用周期频繁模式挖掘的方法。

发明内容

本发明的主要目的在于提供一种应用于购买模式下的高效用周期频繁模式挖掘的方法,以解决现有技术中大多数关于周期模式的研究都是在单个序列中挖掘,并且没有考虑模式的内部效用和外部效用的问题。

为实现上述目的,本发明提供了一种应用于购买模式下的高效用周期频繁模式挖掘的方法,包括如下步骤:

步骤1,输入一段时间内客户购买的商品和数量的数据库,商家自定义五个阈值,即最小支持率阈值minSupRa、最大周期性阈值maxPr、最大标准偏差阈值maxStd、最小高效用阈值minHuRa和最小序列周期率阈值minSeqRa;

步骤2,扫描数据库构建1项集x的HUPFPS-list,即构建关于某个商品x出现在哪几个用户的购买序列中、按照时间顺序依次出现在哪笔交易中以及商品的效用构成的数据列表HUPFPS-list,判断1项集x是否为高效用周期频繁模式HUPFPS,具体包括:

步骤2.1,扫描数据库中的每条序列并计算出1项集x的支持率supRa({x}, S),最大周期数maxPer({x}, S),效用比率utiRa({x}, S)和周期标准差stanDev({x}, S);

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211463101.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top