[发明专利]基于广电大数据的用户流失预警方法、系统及存储介质在审
申请号: | 201811494472.1 | 申请日: | 2018-12-07 |
公开(公告)号: | CN109508329A | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 王昌雄;唐昊;刘智 | 申请(专利权)人: | 广州市诚毅科技软件开发有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/242;G06K9/62;H04N21/45 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 510300 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练特征 用户判别 大数据 存储介质 数据清洗 业务需求 用户识别 准确率 预警 用户交互数据 构造特征 领域知识 特征构造 业务经验 用户基础 配置的 配置 采集 主观 应用 分析 | ||
1.基于广电大数据的用户流失预警方法,其特征在于:包括以下步骤:
根据业务需求配置流失用户的识别特征;
根据业务需求配置识别特征的取值范围和时间范围;
根据配置的取值范围和时间范围,对采集的用户交互数据和用户基础资料进行数据清洗;
根据数据清洗后的结果,构造待训练特征;
根据待训练特征,生成流失用户判别模型;
根据识别特征,通过流失用户判别模型进行流失用户识别。
2.根据权利要求1所述的基于广电大数据的用户流失预警方法,其特征在于:所述根据业务需求配置识别特征的取值范围和时间范围这一步骤,包括以下步骤:
根据业务需求配置识别特征的用户基础指标和用户行为指标;
根据业务需求配置待采集数据的时间范围;
其中,所述用户基础指标包括用户资料类数据、客户资料类数据、支付类数据、账单类数据和产品类数据。
3.根据权利要求2所述的基于广电大数据的用户流失预警方法,其特征在于:
所述用户资料类数据包括用户名、用户所属地市、用户开户时间、用户状态、用户的业务类型、用户归属分公司和用户状态变化时间;
所述客户资料类数据包括客户名、客户分级、客户证件号码、客户状态、客户属性、客户类型和客户贡献度;
所述支付类数据包括基本收视维护费、视频增值服务费、数据服务费、带宽服务费和支付方式;
所述账单类数据包括账单金额、冲销金额、欠费金额和账单类型;
所述产品类数据包括销售品名称、套餐名称、产品类型、产品单价、订购产品时间和订购产品状态。
4.根据权利要求1所述的基于广电大数据的用户流失预警方法,其特征在于:所述根据配置的取值范围和时间范围,对采集的用户交互数据和用户基础资料进行数据清洗这一步骤,包括以下步骤:
根据配置的取值范围和时间范围,对采集的用户交互数据和用户基础资料进行空缺值填充;
根据配置的取值范围和时间范围,对采集的用户交互数据和用户基础资料进行异常值删除;
根据配置的取值范围和时间范围,对采集的用户交互数据和用户基础资料进行重复值删除。
5.根据权利要求1所述的基于广电大数据的用户流失预警方法,其特征在于:所述根据数据清洗后的结果,构造待训练特征这一步骤,包括以下步骤:
根据数据清洗后的结果,得到原始数据表;
根据原始数据表,确认数据表之间的关联关系;
根据数据表之间的关联关系,对数据表进行分组操作;
根据分组操作的结果,生成第一待训练特征;
对数据表中的原始特征进行函数计算,生成第二待训练特征。
6.根据权利要求1所述的基于广电大数据的用户流失预警方法,其特征在于:还包括对流失用户判别模型进行优化的步骤;
所述对流失用户判别模型进行优化这一步骤,包括以下步骤:
根据待训练特征,生成测试集;
通过测试集计算模型准确率;
通过测试集计算模型覆盖率;
通过测试集计算模型命中率;
根据计算得到的准确率、覆盖率和命中率,确定最优流失用户判别模型。
7.根据权利要求1所述的基于广电大数据的用户流失预警方法,其特征在于:还包括对预流失用户进行消费推送的步骤;
所述对预流失用户进行消费推送这一步骤,包括以下步骤:
根据用户的消费数据,向用户推送适合用户消费程度的消费套餐;
根据用户的收视行为,向用户推送适合用户喜好程度的消费产品;
根据用户的消费计划,向用户推送针对用户消费计划的消费产品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市诚毅科技软件开发有限公司,未经广州市诚毅科技软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811494472.1/1.html,转载请声明来源钻瓜专利网。