[发明专利]基于电子标签数据分析的无人值守门店货架布局优化方法在审

专利信息
申请号: 201710673599.9 申请日: 2017-08-09
公开(公告)号: CN107545042A 公开(公告)日: 2018-01-05
发明(设计)人: 肖亮;汪澍;李晓敏;袁霄 申请(专利权)人: 浙江工商大学
主分类号: G06F17/30 分类号: G06F17/30;G06K7/10;G06K17/00
代理公司: 杭州天正专利事务所有限公司33201 代理人: 王兵,黄美娟
地址: 310018 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 对于无人值守门店商品数据分析的货架布局优化方法,具体涉及电子标签商品实时数据采集、关联挖掘算法、频繁项集挖掘等领域的知识。尤其适用于分析及处理无人值守门店商品实时数据,并且借助电子标签进行商品数据收集,利用关联分析算法,从优化频繁集项的角度尽可能提高算法性能,采用改进的兴趣度算法,从而准确找出商品之间的关联,来指导无人值守门店货架布局的优化。本发明在现有的商品数据分析的基础上,提出了一种基于节点集Top‑K频繁项集挖掘算法,并采用POC‑Tree数据结构对输完数据中的数据进行压缩,避免了算法多次扫描数据库的局限性,以较优的性能顺利解决关联规则挖掘过程中支持度难以设定的难题。
搜索关键词: 基于 电子标签 数据 分析 无人 值守 货架 布局 优化 方法
【主权项】:
基于电子标签数据分析的无人值守门店货架布局优化方法,包括以下步骤:步骤1.商品实时数据采集:无人值守门店内安装有电子标签与RFID技术,利用电子价格标签采集每个商品销售数据和销售价格,以及商品的货架位置,并将电子标签系统所存储的数据导入SQL数据库;步骤2.数据预处理:通过数据清理操作删除原始数据中杂乱数据,纠正错误数据,除去空白数据、噪声和无关数据等;如删除退货信息、将多个表进行连接查询、商品进行归类;步骤3.挖掘频繁项集:利用Top‑K频繁项集来挖掘频繁项,用户只需要设置期望挖掘项集的个数K,K表示用户想要挖掘的K个最频繁项集;无需针对不同数据库设置不同支持数;31)构造POC‑Tree:根节点标记为null,每个节点由4个参数组成:NodeName,NOdeCount,Children‑list,Order,POC‑Tree节点数据图如图1所示;POC‑Tree是一种前缀树的变形,每一条分支上的项按照支持度递减排序通过共享前缀的方式压缩事务数据集;前序遍历整个POC‑Tree为每个节点N设置前序编号N.NodeName=p.Name,那么N.Count=N.Count+1,否则创建一个节点N使得N.NodeName=p.NodeName且N.NodeCount=1,Q.Children‑list=N;32)节点集:对于POC‑Tree的一个节点N,将它的先序遍历序号和支持度定义为该节点的N‑info,即N‑info(N)=(Order,NOdecount);相同项的节点信息集合,称为该项的节点集(Nodeset),设置节点集为:item.Nodestets=∪Ni.info,Ni.NodeName=item  (1)设定i的节点集:Nodesets={(od1,a1),(od2,a2)......(odn,an)}  (2)如I=i1i2i3...ik是k‑频繁项集,其中ij∈F1,i1>i2>...ik,令I1=i1i3...ik,I2=i2i3...ik其节点分别表示为和那么有:NodesetsI=NodesetsI1∩NodesetsI2---(3)]]>支持度为:i1i2...ikNodeCount=a1+a2+a3+...am  (4)33)K‑频繁项集的生成:TBN算法采用Top‑K‑Rank表结构,通过动态生成支持度挖掘最频繁K个项集;给定一个事务数据库D和频繁项集A,设RA为该频繁项集的序列,那么有:RA=|{Sup(B)|B⊆Iandsup(B)≥Sup(A)}|---(5)]]>RA反映了项集A在所有结果中的频繁程度,其值大小表示频繁项集A的支持数的排名情况;频繁项集A为最频繁项集时,不存在Sup(B)≥Sup(A),B≠A,因此RA=1表示项集A支持数排名第一;给定一个R值,那么用Rk.items来表示序列为k的项集,记为:Rk.items={i|Ri=k,i⋐I}---(6)]]>将已挖掘出的项集按照支持数降序排列,既相同支持数的项集排列一起,令为R=k对应项集的支持数,那么称为边界支持数:∂=Sup(Rk.items)---(7)]]>给定一个事务数据库D和K(表示支持度最高的前K个项集)有:Top-k-R={A|A⊆IandSup(A)≥∂}---(8)]]>即支持数大于或者等于Top‑k边界支持数的项集共同组成Top‑k频繁项集;步骤4.算法剪枝:根据生成的K项集,进行剪枝,缩小搜索空间;TBN算法引用两个剪枝策略:41)父等价剪枝技术:给定项集S和项i,如果S的支持度等于S∪{i}的支持度,则对于任意项集A,A∩S=Φ且有A∪S的支持度等于A∪S∪{i}的支持度;42)前瞻剪枝技术:如果当前节点与右侧所有邻居节点的并集是已挖掘的最大频繁项集的子集,则以当前节点为根节点的子树不可能存在最大频繁项集;即如果存在Sup(I)=Sup(I∪s),那么存在:通过此性质可以大大缩小搜索空间,提升算法效率;步骤5.兴趣度测量:由数据库D中找出的频繁项集,计算强关联规则,强关联规则满足最小支持度和最小置信度;对于置信度数学公式为:confidence(A⇒B)=P(A|B)=count(A∪B)count(A)---(10)]]>其中count(A∪B)是包含项集A∪B的事物数,而count(A)是包含项集A的事物数;说明买A对买B起抑制作用,改进的兴趣度模型为:interest(A⇒B)=conf(A⇒B)-conf(A‾⇒B)=P(AB)P(A)-P(A‾B)P(A‾)=(P(AB)P(A)P(B)-P(AB‾)P(A‾)P(B))*P(B)=(lift(A,B)-lift(A‾,B))*P(B)---(11)]]>因此基于相关的新的兴趣度模型为:interest(A⇒B)=lift(A,B)-lift(A‾,B)Max(lift(A,B),lift(A‾,B))---(12)]]>其中是标准化因子,使得兴趣度的范围为[‑1,1];步骤6.货架布局优化:通过数据分析产生的关联分析,发现哪些商品频繁的被顾客同时购买,分析顾客购买行为,而后进行商品位置的优化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710673599.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top