[发明专利]一种基于电视机顶盒的视频推荐系统在审
申请号: | 201610258946.7 | 申请日: | 2016-04-25 |
公开(公告)号: | CN105704566A | 公开(公告)日: | 2016-06-22 |
发明(设计)人: | 郑冰 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | H04N21/466 | 分类号: | H04N21/466;G06F17/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孟峣 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 电视 机顶盒 视频 推荐 系统 | ||
技术领域
本发明涉及数字电视技术领域,具体地说是一种实用性强、基于电视机顶盒的视频推荐系统。
背景技术
随着技术的进步,目前我国有线数字电视用户将近2亿,而双向数字电视也得到了大跨步的发展,双向指的是除了接受电视台的信号,用户的数据回传给电视台,从而实现诸如电影点播,快进快退,以及延伸出来的诸如电视查询,电视银行等业务,这类业务都是需要双向数据传输才能实现的。双向机顶盒比单向机顶盒复杂很多,也需要双向网络改造的支持,所以成本高很多。
此外,协同过滤推荐(CollaborativeFilteringrecommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。基于物品协同过滤(ItemBaseCF)的基本思想是预先根据所有用户的历史偏好数据计算物品之间的相似性,然后把与用户喜欢的物品相类似的物品推荐给用户。内容过滤的基本思想是给用户推荐和他们之前喜欢的物品在内容上相似的其他物品。
基于此,本发明提出一种基于电视机顶盒的视频推荐系统,通过使用上述两种算法,实现双向数字电视用户的电视推荐,提高用户体验。
发明内容
本发明的技术任务是针对以上不足之处,提供一种实用性强、基于电视机顶盒的视频推荐系统。
一种基于电视机顶盒的视频推荐系统,包括日志采集系统、推荐引擎,其中日志采集系统收集用户的行为和对推荐引擎的反馈;推荐引擎由分布式计算平台及关系型或NoSql数据库组成,混合使用协同过滤和内容过滤,该推荐引擎是从用户的历史行为中分析出用户的兴趣然后找出符合其兴趣的视频推荐给用户。
所述日志采集系统由机顶盒、服务器端的日志收集系统组成,其中机顶盒上报用户行为记录,服务器端则使用日志收集系统Flume-ng将机顶盒上报的行为日志收集汇总到中心存储HDFS。
机顶盒上报的行为记录是指机顶盒将用户行为信息、用户信息、视频信息以日志文件的形式传给日志采集系统。
行为记录具体包括用户ID、视频ID、视频年代、视频评分、视频类型、视频导演、视频演员、视频地区、视频总时长、用户收看时长、时间戳信息。
服务器端的日志收集系统收集汇总完行为日志后,对所有的行为日志进行过滤、数据清洗,然后汇总到HDFS,使用Spark实现分布式计算算法,计算得出的视频用户喜好信息更新到数据库,并通过机顶盒推荐给用户。
所述分布式计算算法具体为:使用SparkonYarn分布式计算平台,通过物品协同过滤、基于内容过滤算法对用户行为进行分析,得到用户观看矩阵、相似视频矩阵,计算得到推荐结果,其中通过物品协同过滤算法推荐旧的视频资源给机顶盒长期用户,通过内容过滤算法推荐新增用户或新增视频。
当推荐结果计算得出后,该推荐结果导入到关系型数据库、NoSql数据库,然后通过机顶盒查询推荐内容,并将内容展现给用户。
本发明的一种基于电视机顶盒的视频推荐系统,具有以下优点:
本发明提供的一种基于电视机顶盒的视频推荐系统通过协同过滤算法和内容过滤算法的方式,实现电视节目的推荐选择,提升数字电视用户的用户体验,实用性强,智能程度高,符合不同电视观众的需求,易于推广。
附图说明
附图1为本发明的视频推荐系统架构图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
如附图1所示,本发明的一种基于电视机顶盒的视频推荐系统,包括日志采集系统、推荐引擎,其中日志采集系统收集用户的行为和对推荐引擎的反馈;推荐引擎由分布式计算平台及关系型或NoSql数据库组成,混合使用协同过滤和内容过滤,该推荐引擎是从用户的历史行为中分析出用户的兴趣然后找出符合其兴趣的视频推荐给用户。
所述日志采集系统由机顶盒、服务器端的日志收集系统组成,其中机顶盒上报用户行为记录,服务器端则使用日志收集系统Flume-ng将机顶盒上报的行为日志收集汇总到中心存储HDFS。
机顶盒上报的行为记录是指机顶盒将用户行为信息、用户信息、视频信息以日志文件的形式传给日志采集系统。
行为记录具体包括用户ID、视频ID、视频年代、视频评分、视频类型、视频导演、视频演员、视频地区、视频总时长、用户收看时长、时间戳信息。
服务器端的日志收集系统收集汇总完行为日志后,对所有的行为日志进行过滤、数据清洗,然后汇总到HDFS,使用Spark实现分布式计算算法,计算得出的视频用户喜好信息更新到数据库,并通过机顶盒推荐给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610258946.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种歌唱耳机
- 下一篇:一种多屏互动的切换方法及系统