[发明专利]一种视频点击率的预估方法及装置有效
申请号: | 201811094189.X | 申请日: | 2018-09-19 |
公开(公告)号: | CN110933499B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 赵欣莅;李修鹏;田文宝;王超;赵东伟;张志朋;樊锐强;刘庆标;尹学正;温连魁 | 申请(专利权)人: | 飞狐信息技术(天津)有限公司 |
主分类号: | H04N21/442 | 分类号: | H04N21/442;H04N21/45 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 300280 天津市滨海新区经济技术开*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 点击率 预估 方法 装置 | ||
本发明公开了一种视频点击率的预估方法及装置,当判断用户操作满足预设的预估点击率的触发条件时,采集所述用户的用户数据和所述用户操作的操作时间;提取所述用户数据中的用户特征和待预估视频的视频特征,调用第一视频点击率预估模型对所述用户特征、所述待预估视频的视频特征和所述操作时间进行处理,得到所述待预估视频的点击率的预估结果。本发明采用通过深度学习的方式构建的视频点击率预估模型处理特征数据,能够充分的利用非连续性特征数据,得到精准的点击率预估结果。
技术领域
本发明涉及数据处理领域,具体为一种视频点击率的预估方法及装置。
背景技术
点击率是指网站页面上某一内容被点击的次数与被显示次数之比,能够反映网页上某一内容的受关注程度,点击率越高表明受关注程度越高。视频网站管理者经常通过预估点击率的方式,将点击率较高的视频优先投放在网页内,从而提高用户的真实点击率。
目前市场上的视频点击率的预估方法一般采用梯度提升决策树(GradientBoosting Decision Tree,GBDT)和逻辑回归模型(Logistic regression,LR)的融合模型进行视频点击率预估。但随着用户行为所产生的数据越来越多,个性化特征越来越明显,用户行为特征也呈现出高纬度、高稀疏、高度非线性关联的特点,GBDT因其只适合处理连续性特征的局限性,已经无法有效的完成用户行为特征的提取工作,导致视频点击率预估结果不准确。
发明内容
本发明提供了一种视频点击率的预估方法及装置,可以解决现有技术中由于采用GBDT提取用户行为特征,导致视频点击率预估结果不准确的问题。
为达到上述目的,本发明提供了如下技术方案:
一种视频点击率的预估方法,包括:
当判断用户操作满足预设的预估点击率的触发条件时,采集所述用户的用户数据和所述用户操作的操作时间;
提取所述用户数据中的用户特征,所述用户特征为非连续性特征;
提取待预估视频的视频特征,所述视频特征为非连续性特征;
调用第一视频点击率预估模型对所述用户特征、所述待预估视频的视频特征和所述操作时间进行处理,得到所述待预估视频的点击率的预估结果;所述第一视频点击率预估模型基于能够处理非线性特征的深度学习模型构建而成。
可选的,所述提取所述用户数据中的用户特征,包括:
根据第一预设提取规则提取所述用户数据中的特征,得到第一特征组;
删除所述第一特征组中相关性小的特征,得到第二特征组;
对所述第二特征组进行连续特征离散化处理,得到第三特征组;
对所述第三特征组中的特征进行离散变量编码,得到编码后的第三特征组,所述编码后的第三特征组即为所述用户特征。
可选的,所述提取待预估视频的视频特征,包括:
根据第二预设提取规则提取所述待预付视频中的特征,得到第四特征组;
删除所述第四特征组中相关性小的特征,得到第五特征组;
对所述第五特征组进行连续特征离散化处理,得到第六特征组;
对所述第六特征组中的特征进行离散变量编码,得到编码后的第六特征组,所述编码后的第六特征组即为所述视频特征。
可选的,所述视频点击率预估模型的构建过程,包括:
采集用户历史行为数据,所述用户历史行为数据包括用户历史数据、所述用户历史数据对应的视频历史数据、以及所述用户历史数据中的用户点击视频时的点击时间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞狐信息技术(天津)有限公司,未经飞狐信息技术(天津)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811094189.X/2.html,转载请声明来源钻瓜专利网。