[发明专利]基于电子标签数据分析的无人值守门店货架布局优化方法在审
申请号: | 201710673599.9 | 申请日: | 2017-08-09 |
公开(公告)号: | CN107545042A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | 肖亮;汪澍;李晓敏;袁霄 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K7/10;G06K17/00 |
代理公司: | 杭州天正专利事务所有限公司33201 | 代理人: | 王兵,黄美娟 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 对于无人值守门店商品数据分析的货架布局优化方法,具体涉及电子标签商品实时数据采集、关联挖掘算法、频繁项集挖掘等领域的知识。尤其适用于分析及处理无人值守门店商品实时数据,并且借助电子标签进行商品数据收集,利用关联分析算法,从优化频繁集项的角度尽可能提高算法性能,采用改进的兴趣度算法,从而准确找出商品之间的关联,来指导无人值守门店货架布局的优化。本发明在现有的商品数据分析的基础上,提出了一种基于节点集Top‑K频繁项集挖掘算法,并采用POC‑Tree数据结构对输完数据中的数据进行压缩,避免了算法多次扫描数据库的局限性,以较优的性能顺利解决关联规则挖掘过程中支持度难以设定的难题。 | ||
搜索关键词: | 基于 电子标签 数据 分析 无人 值守 货架 布局 优化 方法 | ||
【主权项】:
基于电子标签数据分析的无人值守门店货架布局优化方法,包括以下步骤:步骤1.商品实时数据采集:无人值守门店内安装有电子标签与RFID技术,利用电子价格标签采集每个商品销售数据和销售价格,以及商品的货架位置,并将电子标签系统所存储的数据导入SQL数据库;步骤2.数据预处理:通过数据清理操作删除原始数据中杂乱数据,纠正错误数据,除去空白数据、噪声和无关数据等;如删除退货信息、将多个表进行连接查询、商品进行归类;步骤3.挖掘频繁项集:利用Top‑K频繁项集来挖掘频繁项,用户只需要设置期望挖掘项集的个数K,K表示用户想要挖掘的K个最频繁项集;无需针对不同数据库设置不同支持数;31)构造POC‑Tree:根节点标记为null,每个节点由4个参数组成:NodeName,NOdeCount,Children‑list,Order,POC‑Tree节点数据图如图1所示;POC‑Tree是一种前缀树的变形,每一条分支上的项按照支持度递减排序通过共享前缀的方式压缩事务数据集;前序遍历整个POC‑Tree为每个节点N设置前序编号N.NodeName=p.Name,那么N.Count=N.Count+1,否则创建一个节点N使得N.NodeName=p.NodeName且N.NodeCount=1,Q.Children‑list=N;32)节点集:对于POC‑Tree的一个节点N,将它的先序遍历序号和支持度定义为该节点的N‑info,即N‑info(N)=(Order,NOdecount);相同项的节点信息集合,称为该项的节点集(Nodeset),设置节点集为:item.Nodestets=∪Ni.info,Ni.NodeName=item (1)设定i的节点集:Nodesets={(od1,a1),(od2,a2)......(odn,an)} (2)如I=i1i2i3...ik是k‑频繁项集,其中ij∈F1,i1>i2>...ik,令I1=i1i3...ik,I2=i2i3...ik其节点分别表示为和那么有:NodesetsI=NodesetsI1∩NodesetsI2---(3)]]>支持度为:i1i2...ikNodeCount=a1+a2+a3+...am (4)33)K‑频繁项集的生成:TBN算法采用Top‑K‑Rank表结构,通过动态生成支持度挖掘最频繁K个项集;给定一个事务数据库D和频繁项集A,设RA为该频繁项集的序列,那么有:RA=|{Sup(B)|B⊆Iandsup(B)≥Sup(A)}|---(5)]]>RA反映了项集A在所有结果中的频繁程度,其值大小表示频繁项集A的支持数的排名情况;频繁项集A为最频繁项集时,不存在Sup(B)≥Sup(A),B≠A,因此RA=1表示项集A支持数排名第一;给定一个R值,那么用Rk.items来表示序列为k的项集,记为:Rk.items={i|Ri=k,i⋐I}---(6)]]>将已挖掘出的项集按照支持数降序排列,既相同支持数的项集排列一起,令为R=k对应项集的支持数,那么称为边界支持数:∂=Sup(Rk.items)---(7)]]>给定一个事务数据库D和K(表示支持度最高的前K个项集)有:Top-k-R={A|A⊆IandSup(A)≥∂}---(8)]]>即支持数大于或者等于Top‑k边界支持数的项集共同组成Top‑k频繁项集;步骤4.算法剪枝:根据生成的K项集,进行剪枝,缩小搜索空间;TBN算法引用两个剪枝策略:41)父等价剪枝技术:给定项集S和项i,如果S的支持度等于S∪{i}的支持度,则对于任意项集A,A∩S=Φ且有A∪S的支持度等于A∪S∪{i}的支持度;42)前瞻剪枝技术:如果当前节点与右侧所有邻居节点的并集是已挖掘的最大频繁项集的子集,则以当前节点为根节点的子树不可能存在最大频繁项集;即如果存在Sup(I)=Sup(I∪s),那么存在:通过此性质可以大大缩小搜索空间,提升算法效率;步骤5.兴趣度测量:由数据库D中找出的频繁项集,计算强关联规则,强关联规则满足最小支持度和最小置信度;对于置信度数学公式为:confidence(A⇒B)=P(A|B)=count(A∪B)count(A)---(10)]]>其中count(A∪B)是包含项集A∪B的事物数,而count(A)是包含项集A的事物数;说明买A对买B起抑制作用,改进的兴趣度模型为:interest(A⇒B)=conf(A⇒B)-conf(A‾⇒B)=P(AB)P(A)-P(A‾B)P(A‾)=(P(AB)P(A)P(B)-P(AB‾)P(A‾)P(B))*P(B)=(lift(A,B)-lift(A‾,B))*P(B)---(11)]]>因此基于相关的新的兴趣度模型为:interest(A⇒B)=lift(A,B)-lift(A‾,B)Max(lift(A,B),lift(A‾,B))---(12)]]>其中是标准化因子,使得兴趣度的范围为[‑1,1];步骤6.货架布局优化:通过数据分析产生的关联分析,发现哪些商品频繁的被顾客同时购买,分析顾客购买行为,而后进行商品位置的优化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710673599.9/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置