[发明专利]一种电商平台的推荐方法及系统有效
申请号: | 201910973429.1 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110956528B | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 杨森彬;张小波 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平台 推荐 方法 系统 | ||
本发明公开了一种电商平台的推荐方法及系统,所述方法将第一预测算法、第二预测算法作为Stacking算法的初级学习器对训练集进行预测,得到两个预测数据集;选取多个强特征,求出训练集中所述强特征对应的多组权重向量,分别对两个预测数据集进行赋权,得到对应的预测数据集,用这些数据集分别训练次级学习器,得到对应的多个训练模型;利用多个训练模型对待预测数据集进行预测,将多个训练模型预测结果的平均值作为最终的预测结果。本发明弥补了之前模型研究的不足,提高电商平台对顾客购买概率的预测准确度,模型效果更优,使模型在电商平台使用范围更广,更容易泛化和推广。
技术领域
本发明涉及数据挖掘领域,具体涉及一种电商平台的推荐方法及系统。
背景技术
数据挖掘运用相关的算法从大量的、不完全的、有噪声的、模糊的、随机的数据中提取正确的、有用的、未知的、综合的以及用户感兴趣的知识,建立模型,用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中的信息的过程。随着互联网时代的到来和数据大爆发,数据挖掘技术普遍而且迫切地应用于各个领域,比如金融、电信、保险、医疗、餐饮等行业。它通过运用整理、分析、总结、推理等方法对大量地数据进行处理,从而对实际问题进行指导和分析,得出相关地预测结果,从而做出更加有利的决策。
当前,随着消费者生活水平逐步升高,在消费者中出现的消费升级现象日益明显,涌现出很多新奇的电商模式,如社交电商等。电商平台充满活力,竞争也趋于激烈。在这种背景下,如果能更好地利用数据,运用数据挖掘技术对数据进行分析、预测,为电商平台赋能,让平台更具精准和个性化,给电商平台注入更多活力,让平台为消费者更好的商品和服务。与此同时,让技术为电商平台创造更大的利润空间。
现有的预测算法虽然在某一个方面具有较为优异的效果,但实际应用过程,很多情况下都是基于单个预测算法的应用,不能很好地利用各个预测算法的优点而避开其缺点,从而难以做到预测算法融合的有效利用。
发明内容
本发明的目的是提供一种电商平台的推荐方法及系统,以使电商平台的个性化推荐预测更为精准。
为了实现上述任务,本发明采用以下技术方案:
一种电商平台的推荐方法,包括:
将第一预测算法、第二预测算法作为Stacking算法的初级学习器,先通过建立好的训练集作为输入对所述第一预测算法、第二预测算法这两个初级学习器进行预测,得到两个预测数据集;
选取多个强特征,求出训练集中所述强特征对应的多组权重向量,利用多组权重向量分别对所述的两个预测数据集进行赋权,得到每一组权重向量赋权后对应的预测数据集;
利用每一组权重向量赋权后对应的预测数据集分别训练次级学习器,得到对应的多个训练模型;
利用多个训练模型对待预测数据集进行预测,将多个训练模型预测结果的平均值作为最终的预测结果。
进一步地,所述的第一预测算法采用XGBoost算法,第二预测算法采用LightGBM算法。
进一步地,所述的训练集中的数据包括多个顾客的历史购买量、购买种类的集中程度以及历史转化率。
进一步地,所述选取多个强特征,求出训练集中所述强特征对应的多组权重向量,包括:
择训练集中历史购买量、购买种类的集中程度以及历史转化率作为强特征进行归一化,得到历史购买量的权重向量、购买种类的集中程度的权重向量以及历史转化率的权重向量。
一种电商平台的推荐系统,包括:
预测数据集建立模块,用于将第一预测算法、第二预测算法作为Stacking算法的初级学习器,先通过建立好的训练集作为输入对所述第一预测算法、第二预测算法这两个初级学习器进行预测,得到两个预测数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910973429.1/2.html,转载请声明来源钻瓜专利网。