[发明专利]基于电商运营数据识别刷单店铺的预警方法及系统在审
申请号: | 202110683402.6 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113393245A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 贾晓萌;谢传家;姚民伟 | 申请(专利权)人: | 浪潮卓数大数据产业发展有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06N20/00;G06K9/62 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 214029 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 运营 数据 识别 店铺 预警 方法 系统 | ||
1.一种基于电商运营数据识别刷单店铺的预警方法,其特征在于,该方法是通过采集电子商务平台的商品及店铺的综合信息,通过对店铺top商品进行集中分析,识别页面展示的商品销量是否为真实销量,并根据识别结果进行刷单预警;具体如下:
信息爬取:通过对主流电商平台的店铺及商品信息进行爬取,获取店铺唯一标识id、商品id及商品销量的信息;
筛选店铺:通过制定的筛选规则,并借助数据库工具缩小刷单店铺的检查范围;
建立店铺刷单预警模型:通过建立店铺刷单预警模型对检查范围内店铺中的高销量商品进行判定,输出对应店铺的高销量商品是否为刷单商品以及对应店铺是否为刷单店铺,并将结果提供给消费者参考。
2.根据权利要求1所述的基于电商运营数据识别刷单店铺的预警方法,其特征在于,信息爬取具体如下:
利用爬虫技术,获取既定周期内电商平台的商品经营数据;其中,商品经营数据包括商品id、商品名称、商品销量及商品销售额;
利用爬虫技术获取到商品与店铺的唯一对应关系以及单个商品销量与店铺内最高销量的比值,并存储到数据库中。
3.根据权利要求1所述的基于电商运营数据识别刷单店铺的预警方法,其特征在于,筛选店铺具体如下:
利用分布式数据处理和过滤技术,将所有可能存在刷单行为的商品提取出来;
通过商品和店铺的对应关系得到所有可能存在刷单行为的店铺,将店铺信息存储到数据库中。
4.根据权利要求3所述的基于电商运营数据识别刷单店铺的预警方法,其特征在于,筛选店铺过程中排除如下两个情况:
(1)、排除零部件和/或材料批发店铺;
(2)、排除低销量店铺:月度总销量低于5000的店铺不予以考虑。
5.根据权利要求1所述的基于电商运营数据识别刷单店铺的预警方法,其特征在于,建立店铺刷单预警模型具体如下:
数据集预处理;
构建店铺刷单预警模型;
数据分割及店铺刷单预警模型调优。
6.根据权利要求5所述的基于电商运营数据识别刷单店铺的预警方法,其特征在于,数据集预处理具体如下:
去除掉数据集中的索引维度,即暂时去掉user_id字段、shop_name字段及shop_url字段;
对数据集存在的空值进行补充:出现空值的字段由开店时长、店铺三项评分以及使用字段平均值对空值进行补充;
使用哑变量对数据集中存在非数值型的字段进行转换,将数据集中非数值型变量转换为数值型变量。
7.根据权利要求5所述的基于电商运营数据识别刷单店铺的预警方法,其特征在于,店铺刷单预警模型构建过程中采用随机森林来进行分类及预测任务,具体如下:
采用放回抽样的方式从数据集中抽取独立的店铺top商品数据;
随机从所有维度中抽取几个店铺top商品数据完成数据的自身构建。
8.根据权利要求5所述的基于电商运营数据识别刷单店铺的预警方法,其特征在于,数据分割及店铺刷单预警模型调优具体如下:
随机选择n个属性进行学习,使得OOBerror最小的属性个数n,在保证每个数据的OOBerror最小的同时,使得整个数据集的误差最小;其中,在放回抽样过程中未被抽取的数据称为袋外数据;使用袋外数据实时监测对应店铺top数据的误差,即OutOfBagError袋外误差,简称为OOBerror;
确定数据的数量m,确保数量m确定后,OOBerror不会再降低;
确定好参数m后,对随机森林进行训练,获取训练结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮卓数大数据产业发展有限公司,未经浪潮卓数大数据产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110683402.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置