[发明专利]基于电子标签数据分析的无人值守门店货架布局优化方法在审

申请号：	201710673599.9	申请日：	2017-08-09
公开（公告）号：	CN107545042A	公开（公告）日：	2018-01-05
发明（设计）人：	肖亮;汪澍;李晓敏;袁霄	申请（专利权）人：	浙江工商大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06K7/10;G06K17/00
代理公司：	杭州天正专利事务所有限公司33201	代理人：	王兵,黄美娟
地址：	310018 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	对于无人值守门店商品数据分析的货架布局优化方法，具体涉及电子标签商品实时数据采集、关联挖掘算法、频繁项集挖掘等领域的知识。尤其适用于分析及处理无人值守门店商品实时数据，并且借助电子标签进行商品数据收集，利用关联分析算法，从优化频繁集项的角度尽可能提高算法性能，采用改进的兴趣度算法，从而准确找出商品之间的关联，来指导无人值守门店货架布局的优化。本发明在现有的商品数据分析的基础上，提出了一种基于节点集Top‑K频繁项集挖掘算法，并采用POC‑Tree数据结构对输完数据中的数据进行压缩，避免了算法多次扫描数据库的局限性，以较优的性能顺利解决关联规则挖掘过程中支持度难以设定的难题。
搜索关键词：	基于电子标签数据分析无人值守货架布局优化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

基于电子标签数据分析的无人值守门店货架布局优化方法，包括以下步骤：步骤1.商品实时数据采集：无人值守门店内安装有电子标签与RFID技术，利用电子价格标签采集每个商品销售数据和销售价格，以及商品的货架位置，并将电子标签系统所存储的数据导入SQL数据库；步骤2.数据预处理：通过数据清理操作删除原始数据中杂乱数据，纠正错误数据，除去空白数据、噪声和无关数据等；如删除退货信息、将多个表进行连接查询、商品进行归类；步骤3.挖掘频繁项集：利用Top‑K频繁项集来挖掘频繁项，用户只需要设置期望挖掘项集的个数K，K表示用户想要挖掘的K个最频繁项集；无需针对不同数据库设置不同支持数；31)构造POC‑Tree：根节点标记为null，每个节点由4个参数组成：NodeName，NOdeCount，Children‑list，Order，POC‑Tree节点数据图如图1所示；POC‑Tree是一种前缀树的变形，每一条分支上的项按照支持度递减排序通过共享前缀的方式压缩事务数据集；前序遍历整个POC‑Tree为每个节点N设置前序编号N.NodeName＝p.Name，那么N.Count＝N.Count+1，否则创建一个节点N使得N.NodeName＝p.NodeName且N.NodeCount＝1，Q.Children‑list＝N；32)节点集：对于POC‑Tree的一个节点N，将它的先序遍历序号和支持度定义为该节点的N‑info，即N‑info(N)＝(Order，NOdecount)；相同项的节点信息集合，称为该项的节点集(Nodeset)，设置节点集为：item.Nodestets＝∪Ni.info,Ni.NodeName＝item (1)设定i的节点集：Nodesets＝{(od1,a1),(od2,a2)......(odn,an)} (2)如I＝i1i2i3...ik是k‑频繁项集，其中ij∈F1,i1＞i2＞...ik，令I1＝i1i3...ik，I2＝i2i3...ik其节点分别表示为和那么有：NodesetsI=NodesetsI1∩NodesetsI2---(3)]]>支持度为：i1i2...ikNodeCount＝a1+a2+a3+...am (4)33)K‑频繁项集的生成：TBN算法采用Top‑K‑Rank表结构，通过动态生成支持度挖掘最频繁K个项集；给定一个事务数据库D和频繁项集A，设RA为该频繁项集的序列，那么有：RA=|{Sup(B)|B⊆Iandsup(B)≥Sup(A)}|---(5)]]>RA反映了项集A在所有结果中的频繁程度，其值大小表示频繁项集A的支持数的排名情况；频繁项集A为最频繁项集时，不存在Sup(B)≥Sup(A),B≠A，因此RA＝1表示项集A支持数排名第一；给定一个R值，那么用Rk.items来表示序列为k的项集，记为：Rk.items={i|Ri=k,i⋐I}---(6)]]>将已挖掘出的项集按照支持数降序排列,既相同支持数的项集排列一起，令为R＝k对应项集的支持数，那么称为边界支持数：∂=Sup(Rk.items)---(7)]]>给定一个事务数据库D和K(表示支持度最高的前K个项集)有：Top-k-R={A|A⊆IandSup(A)≥∂}---(8)]]>即支持数大于或者等于Top‑k边界支持数的项集共同组成Top‑k频繁项集；步骤4.算法剪枝：根据生成的K项集，进行剪枝，缩小搜索空间；TBN算法引用两个剪枝策略：41)父等价剪枝技术：给定项集S和项i，如果S的支持度等于S∪{i}的支持度，则对于任意项集A，A∩S＝Φ且有A∪S的支持度等于A∪S∪{i}的支持度；42)前瞻剪枝技术：如果当前节点与右侧所有邻居节点的并集是已挖掘的最大频繁项集的子集，则以当前节点为根节点的子树不可能存在最大频繁项集；即如果存在Sup(I)＝Sup(I∪s),那么存在：通过此性质可以大大缩小搜索空间，提升算法效率；步骤5.兴趣度测量：由数据库D中找出的频繁项集，计算强关联规则，强关联规则满足最小支持度和最小置信度；对于置信度数学公式为：confidence(A⇒B)=P(A|B)=count(A∪B)count(A)---(10)]]>其中count(A∪B)是包含项集A∪B的事物数，而count(A)是包含项集A的事物数；说明买A对买B起抑制作用，改进的兴趣度模型为：interest(A⇒B)=conf(A⇒B)-conf(A‾⇒B)=P(AB)P(A)-P(A‾B)P(A‾)=(P(AB)P(A)P(B)-P(AB‾)P(A‾)P(B))*P(B)=(lift(A,B)-lift(A‾,B))*P(B)---(11)]]>因此基于相关的新的兴趣度模型为：interest(A⇒B)=lift(A,B)-lift(A‾,B)Max(lift(A,B),lift(A‾,B))---(12)]]>其中是标准化因子，使得兴趣度的范围为[‑1,1]；步骤6.货架布局优化：通过数据分析产生的关联分析，发现哪些商品频繁的被顾客同时购买，分析顾客购买行为，而后进行商品位置的优化。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工商大学，未经浙江工商大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710673599.9/，转载请声明来源钻瓜专利网。

上一篇：一种工业废气净化吸附剂及其制备方法
下一篇：一种去除工业污水中重金属的药剂及其制备方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于电子标签数据分析的无人值守门店货架布局优化方法在审

专利文献下载