[发明专利]一种基于互联网电视使用行为的用户流失预测方法及终端有效
| 申请号: | 202011247722.9 | 申请日: | 2020-11-10 |
| 公开(公告)号: | CN112449240B | 公开(公告)日: | 2022-12-06 |
| 发明(设计)人: | 程光剑 | 申请(专利权)人: | 深圳市易平方网络科技有限公司 |
| 主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/442;H04N21/45;G06K9/62 |
| 代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 陈专 |
| 地址: | 518057 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 互联网 电视 使用 行为 用户 流失 预测 方法 终端 | ||
1.一种基于互联网电视使用行为的用户流失预测方法,其特征在于,所述基于互联网电视使用行为的用户流失预测方法包括:
获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵;
获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵;
获取用户的观影行为数据,构建节目偏好矩阵;
将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率;
所述获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵,具体包括:
基于用户观看节目获取节目信息数据,对节目简介进行分词向量化处理,得到节目矩阵a2m×j;
其中,m为用户数,j为节目简介特征个数;
通过聚类算法将所述节目矩阵a2m×j进行降维处理,将所述节目矩阵a2m×j优化得到节目简介矩阵a3m×k;
其中,m为用户数,k为用户维度提取的特征个数;
所述通过聚类算法将所述节目矩阵a2m×j进行降维处理,具体包括:
随机从所述节目矩阵a2m×j选取k列特征作为初始聚类中心c1、c2、...、ck;
计算所述节目矩阵a2m×j中一个特征与当前聚类中心的最短距离,将该特征归入最短距离所在的类别中,将每个类别中心更新为隶属于该类别的所有特征的均值;
计算所述节目矩阵a2m×j中剩余特征与当前聚类中心的最短距离,直到类别中心的变化小于某个阈值,最后得到节目简介矩阵a3m×k,其中,k<j。
2.根据权利要求1所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵,具体包括:
获取用户的基本属性特征,按预设周期统计用户在周期内的各时段是否处于开机的开机信息;
根据所述基本属性特征和所述开机信息构建用户矩阵a1m×i;
其中,m为用户数,i为用户维度提取的特征个数。
3.根据权利要求2所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述基本属性特征包括:用户地域、年龄和性别。
4.根据权利要求2所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述获取用户的观影行为数据,构建节目偏好矩阵,具体包括:
统计预设周期内用户所有节目观看的日均时长和日均次数,提取用户的日均时长和日均次数;
根据所述日均时长和所述日均次数构建节目偏好矩阵a3m×l;
其中,m为用户数,l为用户节目偏好维度提取的特征个数。
5.根据权利要求4所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率,具体包括:
将所述用户矩阵a1m×i、所述节目简介矩阵a3m×k和所述节目偏好矩阵a3m×l合并成计算矩阵am×n;
其中,m为用户数,n为总特征个数,n=i+k+l;
根据所述计算矩阵,通过预测模型预测各个用户在未来一段时间的流失概率。
6.根据权利要求1-5任一项所述的基于互联网电视使用行为的用户流失预测方法,其特征在于,所述预设周期为24小时。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市易平方网络科技有限公司,未经深圳市易平方网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011247722.9/1.html,转载请声明来源钻瓜专利网。





