[发明专利]一种基于互联网电视使用行为的用户流失预测方法及终端有效
| 申请号: | 202011247722.9 | 申请日: | 2020-11-10 |
| 公开(公告)号: | CN112449240B | 公开(公告)日: | 2022-12-06 |
| 发明(设计)人: | 程光剑 | 申请(专利权)人: | 深圳市易平方网络科技有限公司 |
| 主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/442;H04N21/45;G06K9/62 |
| 代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 陈专 |
| 地址: | 518057 广东省深圳市南山区粤*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 互联网 电视 使用 行为 用户 流失 预测 方法 终端 | ||
本发明公开了一种基于互联网电视使用行为的用户流失预测方法及终端,所述方法包括:获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵;获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵;获取用户的观影行为数据,构建节目偏好矩阵;将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率。本发明通过采集预设周期内不同时段的节目信息提高了特征个数,可以获取丰富的用户行为特征数据,提高了电视用户流失预测的准确度。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于互联网电视使用行为的用户流失预测方法及终端。
背景技术
在现有的针对电视用户流失预测的模型方法中,大部分都是提取用户地域、性别、年龄等基础属性、以及观看节目的次数和时长与节目的类别属性作为预测模型中的特征,最后预测得到各个用户在未来一段时间不使用电视的概率,这种方法提取的特征较为基础,无法获取丰富的用户行为特征数据。
因此,现有技术还有待于改进和发展。
发明内容
本发明的主要目的在于提供一种基于互联网电视使用行为的用户流失预测方法及终端,旨在解决现有技术中无法准确预测电视用户流失的问题。
为实现上述目的,本发明提供一种基于互联网电视使用行为的用户流失预测方法,所述基于互联网电视使用行为的用户流失预测方法包括如下步骤:
获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵;
获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵;
获取用户的观影行为数据,构建节目偏好矩阵;
将所述用户矩阵、所述节目简介矩阵和所述节目偏好矩阵合并成计算矩阵,将所述计算矩阵输入到预测模型中预测用户流失概率。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述获取用户的基本属性特征和预设周期内的开机信息,构建用户矩阵,具体包括:
获取用户的基本属性特征,按预设周期统计用户在周期内的各时段是否处于开机的开机信息;
根据所述基本属性特征和所述开机信息构建用户矩阵a1m×i;
其中,m为用户数,i为用户维度提取的特征个数。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述基本属性特征包括:用户地域、年龄和性别。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述获取节目信息数据,对节目简介进行分词向量化处理,构造节目矩阵,将所述节目矩阵进行降维处理后得到节目简介矩阵,具体包括:
基于用户观看节目获取节目信息数据,对节目简介进行分词向量化处理,得到节目矩阵a2m×j;
其中,m为用户数,j为节目简介特征个数;
通过聚类算法将所述节目矩阵a2m×j进行降维处理,将所述节目矩阵a2m×j优化得到节目简介矩阵a3m×k;
其中,m为用户数,k为用户维度提取的特征个数。
可选地,所述的基于互联网电视使用行为的用户流失预测方法,其中,所述通过聚类算法将所述节目矩阵a2m×j进行降维处理,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市易平方网络科技有限公司,未经深圳市易平方网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011247722.9/2.html,转载请声明来源钻瓜专利网。





