[发明专利]基于用户行为特征挖掘用户潜在购买商品和品类的方法在审

专利信息
申请号: 201910687675.0 申请日: 2019-07-29
公开(公告)号: CN110555717A 公开(公告)日: 2019-12-10
发明(设计)人: 程锐;张艳青;杨漫瑶 申请(专利权)人: 华南理工大学
主分类号: G06Q30/02 分类号: G06Q30/02;G06Q30/06
代理公司: 44245 广州市华学知识产权代理有限公司 代理人: 林梅繁
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 预测模型 正负样本 购买商品 融合 用户行为特征 预处理 用户行为分析 决策树模型 工程处理 数据编码 数据挖掘 样本数据 样本子集 预测结果 欠采样 转换率 权重 商户 分析 挖掘 分类 营销 预测 购买 帮助
【权利要求书】:

1.基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,包括:

数据清洗与数据预处理,得到预处理后的数据;

对预处理后的数据进行数据编码,并提取基本特征、统计类特征、时间间隔类特征、计算类特征,对提取的特征通过过滤法进行特征重要性评估,筛选出重要特征和冗余特征,在进行特征重要性评估过程,针对某些用户行为离预测时间越近对结果影响越大,引入时间衰退理论,对数据特征进行加权处理,得到用户行为特征数据;

对样本数据进行正负样本分析与分类,将正负样本通过动态欠采样处理生成多个样本子集,作为训练的正负样本数据;

通过正负样本数据对决策树模型进行训练,训练出多个单预测模型,再通过stacking方式对单预测模型进行融合,生成多个融合预测模型;

利用融合预测模型进行预测,将预测结果与期望值进行对比,反馈给决策树模型进行参数调整和模型再训练,直到得出最优的模型参数;

基于多个融合预测模型对用户潜在购买商品和品类进行预测,对各个融合预测模型的预测结果进行处理分析,得到带有权重的用户潜在购买商品和品类。

2.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,过滤法指的是采用相关系数法对每个特征按照指标进行打分,这个评分即代表着这个特征的重要性,然后依据评分对特征进行排序。

3.根据权利要求2所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,采用卡方过滤计算每个非负特征和标签之间的卡方统计量,并依照卡方统计量由高到低为特征排名,选出前K个分数最高的特征的类,借此除去最可能独立于标签,与分类目的无关的特征。

4.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,样本数据包括某个用户对于某个商品在一段时间内的行为特征数据、商品、用户本身的特征数据。

5.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,动态欠采样处理是针对样本数量过大的那部分样本,通过一定的方法抽取部分样本,以协调其与其他样本的比例不均衡情况。

6.根据权利要求5所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,通过随机抽取的方式,从负样本中抽取一定数量的子样本,与正样本组合成新的样本集。

7.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,采用的决策树模型为RF和GDBT算法。

8.根据权利要求1所述的基于用户行为特征挖掘用户潜在购买商品和品类的方法,其特征在于,多个单预测模型通过stacking方式生成融合预测模型过程包括:

在处理好正负样本后,生成n个样本训练集train_x、…、train_y和测试集test;

①选择一种未经训练的决策树模型;

②抽取其中n-1份作为小的训练集s_train_x、…、s_train_y,另外一份作为小的测试集s_test,测试集test不变;

③以s_train_x、…、s_train_y训练决策树模型,训练出的模型预测s_test得出对应的s_pred,再预测test得出y_pred;

④在训练集再选择另外一份作为小的测试集s_test_x,其他n-1份作为训练集训练决策树模型;

⑤重复②、③、④步骤n次,得到n个s_pred和n个y_pred;

n个s_pred作为一个train_X,原始的train_y作为train_Y训练融合预测模型得到模型G,n个y_pred取个平均值作为新的test_X,把test_X带入到模型G中得出预测结果;

以上就是stacking的第一层,在第二层中,以第一层的输出训练集train_X、train_Y、测试集test_X再结合其他的特征集再做一层stacking,重复上面的步骤,生成最终的融合预测模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910687675.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top