[发明专利]一种视频热度预测方法、装置、设备及存储介质在审
申请号: | 201811316777.3 | 申请日: | 2018-11-06 |
公开(公告)号: | CN109522470A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 汪浩;刘德洪;喻永淼;贺华玲;丁博;陆宁冰;李晋文 | 申请(专利权)人: | 汪浩 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/73;G06F16/9536;G06Q30/02;G06Q50/00;H04N21/234;H04N21/44 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 510220 广东省广州市海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频热度 预测 特征矩阵 视频 预测模型 计算机可读存储介质 预处理 存储介质 视频数据 特征数据 特征指标 用户需求 预测结果 预先建立 播放 | ||
1.一种视频热度预测方法,其特征在于,包括以下步骤:
根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵;
对所述第一特征矩阵进行预处理,以生成第二特征矩阵;
根据所述待预测视频的类型,选择预先建立的对应的视频热度预测模型;
根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数。
2.根据权利要求1所述的视频热度预测方法,其特征在于,所述待预测视频的类型包括版权剧、网剧、综艺以及网综;
所述视频热度预测模型包括版权剧视频热度预测模型、网剧视频热度预测模型、综艺视频热度预测模型以及网综视频热度预测模型;
所述特征指标包括电视播放平台、网络播放平台、题材、网络热议指数、导演关注度、明星活跃指数以及明星话题热度。
3.根据权利要求1所述的视频热度预测方法,其特征在于,还包括:
根据所述待预测视频,通过爬虫技术从预设网络平台爬取所述待预测视频的视频数据。
4.根据权利要求3所述的视频热度预测方法,其特征在于,所述根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵,具体为:
根据待预测视频的类型,从待预测视频的视频数据中,提取所述待预测视频的类型所对应的特征指标的特征数据;其中,所述待预测视频的类型包括版权剧、网剧、综艺以及网综;
对提取的各个特征指标所对应的特征数据分别进行归一化处理,以生成各个预设特征指标所对应的第三特征矩阵;
根据所述各个第三特征矩阵构造第一特征矩阵。
5.根据权利要求4所述的视频热度预测方法,其特征在于,所述对所述第一特征矩阵进行预处理,以生成第二特征矩阵,具体为:
删除所述第一特征矩阵中空值数量超过预设阈值的数据行,以及属于离群数据的数据行;
对于所述第一特征矩阵中空值数量小于所述预设阈值的数据行,通过多重插补法对所述数据行中的空值进行补全,以生成第二特征矩阵。
6.根据权利要求5所述的视频热度预测方法,其特征在于,所述根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数,具体为:
将所述第二特征矩阵作为选择的所述视频热度预测模型的输入参量,从所述预先建立的视频热度预测模型中获取所述待预测视频的播放量预测结果;
对所述播放量预测结果进行分布调整,以生成播放量预测指数。
7.根据权利要求1至6任意一项所述的视频热度预测方法,其特征在于,所述视频热度预测模型的构建过程包括:
根据待预测视频的类型,通过爬虫技术从预设网络平台爬取在预设时间段内对应所述待预测视频的类型的若干已上映视频的视频数据;其中,所述待预测视频的类型包括版权剧、网剧、综艺以及网综;
从所述已上映视频的视频数据中获取对应于所述待预测视频的类型的特征指标的特征数据,以构造第一训练特征矩阵;
对所述第一训练特征矩阵进行预处理,以生成第二训练特征矩阵;
将所述第二训练特征矩阵以及对应播放量,作为训练集数据,通过随机森林算法进行训练,以生成对应的视频热度预测模型;其中,所述视频热度预测模型包括版权剧视频热度预测模型、网剧视频热度预测模型、综艺视频热度预测模型以及网综视频热度预测模型。
8.一种视频热度预测装置,其特征在于,包括:
第一特征矩形构造单元,用于根据待预测视频的类型,从待预测视频的视频数据中提取对应的特征指标的特征数据,以构造第一特征矩阵;
第二特征矩形生成单元,用于对所述第一特征矩阵进行预处理,以生成第二特征矩阵;
预测模型选择单元,用于根据所述待预测视频的类型,选择预先建立的对应的视频热度预测模型;
预测指数获取单元,用于根据所述第二特征矩阵以及选择的视频热度预测模型,获取所述待预测视频的播放量预测指数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪浩,未经汪浩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811316777.3/1.html,转载请声明来源钻瓜专利网。