[发明专利]一种基于多维度用户画像的电商用户行为数据模拟的方法及系统有效
| 申请号: | 202110957980.4 | 申请日: | 2021-08-20 |
| 公开(公告)号: | CN113487117B | 公开(公告)日: | 2023-10-17 |
| 发明(设计)人: | 袁梦;杨美红;郭莹;张虎;曹文泰;孙明辉;王天伟;白杨 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/0601 |
| 代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
| 地址: | 250014 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多维 用户 画像 商用 行为 数据 模拟 方法 系统 | ||
1.一种基于多维度用户画像的电商用户行为数据模拟的方法,其特征在于,包括以下步骤:
步骤1:构建电商平台基础数据集;
电商平台基础数据集是指包括电商平台各种商品信息的集合,其中包括商品一级分类表、商品二级分类表、商品信息表;步骤2:构建商品间的关联规则表;
关联规则是形如X→Y的蕴涵式,X和Y分别称为关联规则的先导和后继,商品间的关联规则是用来描述两个或多个商品之间的关联性;步骤3:构建多维度用户画像;
先设计一个多维度用户画像框架,再利用该多维度用户画像框架依据使用者的不同需求实例出具体的多维度用户画像;
步骤4:模拟生成电商用户行为数据;
电商用户行为数据包括用户基本信息、用户购物数据和用户浏览记录数据,分别存入用户基本信息表、用户购物数据表、用户浏览记录数据表中。
2.根据权利要求1所述的一种基于多维度用户画像的电商用户行为数据模拟的方法,其特征在于,步骤1中,使用网络爬虫技术从电商web平台爬取大量的商品信息,对爬取的商品信息进行清洗、归纳、整理后存入电商平台基础数据集的各个数据表中,电商平台基础数据集便构建完成。
3.根据权利要求1所述的一种基于多维度用户画像的电商用户行为数据模拟的方法,其特征在于,步骤3中,先设计一个多维度用户画像框架,再利用该多维度用户画像框架依据使用者的不同需求实例出具体的多维度用户画像,具体是指:
多维度用户画像框架包括4个维度:用户偏好维度、用户价值维度、用户活跃维度及用户习惯维度,这四个维度分别从四个层面描绘用户的特征;
用户偏好维度是指能体现用户购物偏好的维度,用户偏好维度包括若干属性;使用者可依据实际需求调整用户偏好维度中属性的数量和内容;
用户价值维度是体现用户对商家的商业价值的维度,用户价值维度体现用户部分的购物规律,用户价值维度包括如下8种属性:重要价值、重要发展、重要保持、重要挽留、一般价值、一般发展、一般保持、一般挽留;重要价值是指:该类用户与企业交易频繁、交易量大,但长时间没有与企业进行交易,存在流失风险,该类高价值用户是企业利润的潜在来源;重要发展是指:该类用户购买量较大,但是从购买频率和近期购买时间来看交易不频繁,该类用户有很高的潜在价值,可采取针对性营销手段吸引他们;重要保持是指:该类用户与企业交易频繁、交易量大,且最近一次交易时间间隔短,实际贡献价值很高,是企业优质客户群;重要挽留是指:该类用户近一次交易时间短、购买金额大,但是购买频率较低,具有很高的潜在价值;一般价值是指:该类用户购买频率较高,但长时间没有与企业进行交易,且购买量很低,企业已很难从他们身上获取更多利润;一般发展是指:从购买频率、购买金额及近期购买情况来看,该类用户属于低价值用户;一般挽留是指:该类用户最近交易时间间隔短,但是购买频率和购买金额相对较低,无法立即给企业带来较大利润;用户活跃维度体现用户在平台的活跃度,用户活跃维度主要影响用户单位时间内产生的数据量,活跃度越高,单位时间内产生的数据量越大,用户活跃维度包括3种属性:低活跃、中活跃、高活跃,分别表示用户在电商平台的三个级别的活跃度;
用户习惯维度体现用户使用平台的时间段分布,用户习惯维度包括4种属性:上午、下午、傍晚、深夜;
在构建完多维度用户画像框架之后,使用者根据需求在框架的每个维度中选取相应的属性进行组合便快速得到一个多维度用户画像,其中,多维度用户画像的用户偏好维度是一个多选维度,用户价值维度、用户活跃维度和用户习惯维度是单选维度。
4.根据权利要求1所述的一种基于多维度用户画像的电商用户行为数据模拟的方法,其特征在于,步骤4中,通过数据生成算法模拟生成电商用户行为数据,具体包括步骤如下:
(1)生成用户基本信息:随机生成一个虚拟电商用户的个人基本信息,包括用户ID、用户名、年龄、性别、注册渠道;年龄的值为满足均值为参数a、方差为参数b的正太分布函数且范围在14到80之间的正整数;
(2)生成用户购物数据:模拟生成一个用户一年内的购物数据,且在生成的购物数据中预埋进输入的用户画像和商品间关联规则的价值信息;
(3)生成用户浏览记录数据:即模拟生成一个用户一年内的浏览记录数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110957980.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





