[发明专利]用户流失预测方法、系统、设备和存储介质在审
申请号: | 201911154066.5 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110930192A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 刘畅;肖铨武;谢超 | 申请(专利权)人: | 携程旅游信息技术(上海)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F16/2458;G06Q50/30 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;张冉 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 流失 预测 方法 系统 设备 存储 介质 | ||
本发明公开了一种用户流失预测方法、系统、设备和存储介质,用户流失预测方法包括以下步骤:获取历史数据,历史数据包括用户的历史行为数据和历史订单数据;对历史数据中的用户进行圈定,以得到标签数据;对标签数据进行预处理以得到样本数据,样本数据包括若干个变量维度;基于样本数据对回归模型进行训练,以得到训练好的预测模型;获取待预测用户的数据,对待预测用户的数据进行预处理以得到包括若干变量维度的待预测数据;基于待预测数据使用预测模型对待预测用户进行预测,以得到待预测用户的流失的概率。本发明能够高效率并准确地对用户流失的概率进行预测。
技术领域
本发明涉及互联网产品技术领域,特别涉及一种用户流失预测方法、系统、设备和存储介质。
背景技术
机票产品是OTA(Online Travel Agency,在线旅游)平台重要的流量入口。用户在OTA平台上购买机票产品不仅会为机票本身带来一定的利润,同时也会为平台上其他产品(如酒店、度假、商旅、签证服务等)带来流量和转化。针对机票用户流失进行预测对于整个OTA平台都有着重要的意义。
现有的做法通常是通过运营人员利用现有规则手工圈定可能流失的用户。处理效率较低;同时手工圈定的方式对用户流失的概率进行预测的准确率也不高。
发明内容
本发明要解决的技术问题是为了克服现有技术中通过运营人员利用现有规则手工圈定可能流失的用户存在处理效率较低,对用户流失的概率进行预测的准确率不高的缺陷,提供一种用户流失预测方法、系统、设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供了一种用户流失预测方法,所述用户流失预测方法包括:
获取历史数据,所述历史数据包括用户的历史行为数据和历史订单数据;
对所述历史数据中的所述用户进行圈定,以得到标签数据;
对所述标签数据进行预处理以得到样本数据,所述样本数据包括若干个变量维度;
基于所述样本数据对回归模型进行训练,以得到训练好的预测模型;
获取待预测用户的数据,对所述待预测用户的数据进行预处理以得到包括所述若干变量维度的待预测数据;
基于所述待预测数据使用所述预测模型对所述待预测用户进行预测,以得到所述待预测用户的流失的概率。
本方案中,利用机器学习的方法构建出准确预测用户流失的方法,解决了通过运营人员利用现有规则手工圈定可能流失的用户存在处理效率较低,对用户流失的概率进行预测的准确率不高的问题。
较佳地,所述用户流失预测方法还包括以下步骤:
将所述预测模型序列化为文件存储至服务器。
本方案中,进一步对模型进行序列化是为了方便传输和存储。本方案中,训练模型和线上部署预测模型是在不同服务器上,另外将预测模型序列化后存储成文件也方便做版本管理和回滚。
较佳地,所述历史行为数据包括历史搜索数据和/或历史浏览数据。
较佳地,所述历史数据为X个月之前的历史数据;
所述对所述历史数据中的所述用户进行圈定,以得到标签数据的步骤包括:
圈定连续N个月内成功订单大于M张且在后续X个月中未下单的所述历史数据中的所述用户为流失用户,所述历史数据中的所述用户中的剩余用户为未流失用户;
对所述流失用户的历史数据打标签,以得到流失标签数据;对所述未流失用户的历史数据打标签,以得到未流失标签数据;
所述标签数据包括所述流失标签数据和所述未流失标签数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游信息技术(上海)有限公司,未经携程旅游信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911154066.5/2.html,转载请声明来源钻瓜专利网。