[发明专利]一种基于假设检验与0‑1整数规划的商品选择方法在审
申请号: | 201710446922.9 | 申请日: | 2017-06-14 |
公开(公告)号: | CN107392642A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 周可;王桦;夏路;乔宏永;孙锡林 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙)42233 | 代理人: | 宋业斌 |
地址: | 430074 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 假设检验 整数 规划 商品 选择 方法 | ||
技术领域
本发明属于计算机数据挖掘领域,更具体地,涉及一种基于假设检验与0-1整数规划的商品选择方法。
背景技术
随着各种电子管理系统越来越多的应用到零售行业中,商家的销售记录普遍被记录了下来。通过分析商品销售历史,如何从商品的全集中,选择出一批最有价值的商品,使得这批商品在未来带来最大的销售利润,这一问题被称为商品选择问题,这一问题与零售行业的商业决策密切相关,使用科学的方法为这一问题给出准确的解决办法,能够更好的提高商家的竞争力。
针对该问题,商家最常用的思路是根据过往的交易记录中,将商品按照其销售利润从高到低排列后进行选择,如果根据交易纪录一个商品的销量高,利润高,就保留该商品,同时去除那些利润较低的商品。
由于在很多场景下,商品的销售并不是独立的,而是有一定的关联性,研究者们将这种商品销售中两两间的关联作用定义为交叉销售作用(Cross-selling effect),现有的商品选择方法并没有考虑到这种交叉销售作用,因此会忽略一些本身销售利润不高,但交叉销售作用强的商品,导致商品选择结果不准确。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于0-1整数规划与假设检验的商品选择方法和系统。其目的在于,根据输入的历史交易数据,挖掘出最有价值的多个商品,同时生成所有商品的单品利润与交叉销售利润权重,从而解决现有商业选择方法中存在的由于没有考虑到交叉销售作用,导致商品选择结果不准确的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种基于假设检验与0-1整数规划的商品选择方法,包括以下步骤:
(1)从商品数据库中读取历史交易数据,并对该历史交易数据进行数据清洗,以分别得到交易数据D和利润数据,其中交易数据D包括交易ID和商品ID,利润数据包括商品ID和商品利润;
(2)利用频繁项集挖掘算法对交易数据D进行处理,以得到大于等于项集支持度阈值的频繁项集;
(3)利用假设检验的方法对步骤(2)得到的频繁项集进行过滤,以提取出多个项集构成有效项集集合;
(4)利用步骤(3)构建的有效项集集合对交易数据D进行处理,以得到商品和有效项集的交易权重;
(5)根据步骤(4)得到的商品和有效项集的交易权重、以及利润数据生成商品利润向量以及有效项集利润向量;
(6)利用0-1整数规划对步骤(5)得到的商品利润向量与有效项集利润向量进行处理,从而得到商品选择结果。
优选地,项集X支持度su(X,D)等于:
其中项集表示一个或多个商品I的集合,n(X)表示交易数据D中项集X出现的数量,n(D)表示交易数据D中的交易数量;
项集支持度阈值的取值等于其中N表示交易数据D的提取周期;
频繁项集挖掘算法是Apriori算法、FP-Growth算法或Eclat算法。
优选地,商品I的支持度su(I,D)等于:
其中n(I)表示交易数据D中的商品数量。
优选地,步骤(3)具体为,计算得到某个项集的支持度su(X,D),然后,继续获得该项集中所有商品的支持度su(Ii,D)和su(Ij,D)、以及所有商品支持度的乘积su(Ii,D)*su(Ij,D),其后,定义零假设:su(X,D)服从参数为n(D)*su(Ii,D)*su(Ij,D)的泊松分布,显著性水平为0至0.1之间,对su(X,D)进行右侧检验,检验的结果如果零假设不成立,则该项集是有效项集,否则该项集不是有效项集。
优选地,步骤(4)包括以下子步骤,
(4-1)获取交易数据D中商品种类的数量m(I),对交易数据D中的所有商品编号为num(I),并获取有效项集数量m(X),对所有有效项集编号为num(X),其中num(I)为1到m(I)间的自然数,num(X)为1到m(X)间的自然数;
(4-2)初始化商品交易向量VI和有效项集交易向量VX为0,商品交易向量VI的长度为m(I),该向量中的第num(I)个值表示编号为num(I)的商品的交易权重,有效项集交易向量VX的长度为有效项集数量m(X),该向量中的第num(X)个值表示编号为num(X)的有效项集的交易权重。
(4-3)对于交易数据D中的每一个交易T,重复以下过程:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710446922.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种书店图书上架系统
- 下一篇:一种追踪及识别网络广告传输数据的方法及系统