[发明专利]一种消费金融场景下的用户购买行为大数据预测方法有效
| 申请号: | 201811535802.7 | 申请日: | 2018-12-14 |
| 公开(公告)号: | CN109509033B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 王进;陈瑀;许景益;欧阳卫华;孙开伟;刘彬 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06Q30/0202 | 分类号: | G06Q30/0202;G06Q30/0207 |
| 代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;陈栋梁 |
| 地址: | 400065 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 消费 金融 场景 用户 购买 行为 数据 预测 方法 | ||
1.一种消费金融场景下的用户购买行为大数据预测方法,其特征在于,包括以下步骤:
步骤101对用户的APP操作行为日志数据进行包括对OCC_TIM字段进行切割在内的预处理操作;
步骤102.根据对用户历史APP操作行为日志数据的分析,对训练集和测试集进行特征工程构建,所述对特征工程进行构建是指得到用户历史APP操作行为日志数据构建离散特征、基础统计特征、时序特征、词袋模型特征和词向量模型特征;
步骤103.通过特征选择法对步骤101得到的特征进行降维;
步骤104.建立2个机器学习模型,分别是.xgboost模型和lightgbm模型,.xgboost模型用于预测出结果1,lightgbm模型用于预测出结果2,并将两个机器学习模型基于模型相关性约束排名的融合操作;
步骤105.通过融合操作建立的模型,根据用户个人属性及其历史APP操作行为日志数据对用户在未来一个周是否购买APP上的优惠券进行预测
所述步骤103对构建特征完成的样本集进行特征选择,具体步骤为:首先计算出每一个特征的方差,然后将方差低于阈值0.5的特征删除;然后将剩余特征分别输入算法xgboost、lightgbm、catboost、GBDT、RF、SVM,输出每个特征的特征重要性,以这些输出的特征重要性为基础构建相关矩阵A,再利用PCA将矩阵A降至指定维度500,完成特征选择;
所述步骤104建立2个机器学习模型,并进行模型融合操作具体步骤为:
步骤1041.xgboost模型:主要设置以下参数'max_depth':3、'objective':'rank:pairwise'、'scale_pos_weight':0.7、'eta':0.02、'min_child_weight':18、'colsample_bytree':0.8、'subsample':0.8;
步骤1042.lightgbm模型:主要设置以下参数'boosting_type':'gbdt'、'num_leaves':31、'learning_rate':0.01、'feature_fraction':0.8、'bagging_fraction':0.8;
步骤1043.多模型融合:采用基于模型相关性约束的排名融合方法,首先通过两个模型输出的特征重要性,将这两组特征重要性看做两组向量,计算其皮尔逊相关系数h;然后在排名融合的机制中加入这一系数,用于约束模型权重对融合结果的影响,当h越大,即两个模型越相关时,权重系数的影响就会增大,当h越小,即两个模型越不相关,权重系数的影响就会减小,其遵循公式:
∑|0.5*(1-h)-(weighti*h)|/ranki公式 (1)
其中weighti为第i个单模型根据验证表现得出的权重系数,它根据各个模型验证得分的比例来计算得到,ranki为样本在第i个模型中的预测值排名,即该样本的预测为正的概率值在整个数据集下的升序排名。
2.根据权利要求1所述的消费金融场景下的用户购买行为大数据预测方法,其特征在于,所述步骤101对用户的APP操作行为日志数据进行预处理操作具体步骤为:
针对于训练集和测试集中的OCC_TIM字段,该字段表示用户行为发生的具体时间,需要事先将它切割为三列分别是:年、月、日。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811535802.7/1.html,转载请声明来源钻瓜专利网。





