[发明专利]一种基于多臂老虎机算法的影视作品推荐方法有效
申请号: | 202110091259.1 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112733004B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 张轶飞;程帆;张冬梅 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06N3/04 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 老虎机 算法 影视作品 推荐 方法 | ||
本发明涉及一种基于多臂老虎机算法的影视作品推荐方法,包括以下步骤:1)获取每个影视作品和当前待推荐用户的特征表示,获得初始的作品聚类和用户聚类;2)遍历所有影视作品,计算对应的预估计回报,选取预估计回报最大的推荐给待推荐用户;3)待推荐用户在接收到推荐后,做出真实反馈;4)基于用户真实反馈更新聚类和预估计回报模型,调整模型中部分超参数,并重新推荐。与现有技术相比,本发明能够较好的平衡推荐方法中的EE问题以及解决推荐方法冷启动问题,具有收敛速度快、推荐精准有效的优点。
技术领域
本发明涉及影视作品推荐及强化学习领域,尤其是涉及一种基于多臂老虎机算法的影视作品推荐方法。
背景技术
在推荐方法领域中,有两个比较经典的问题:一个是EE问题,另一个是用户冷启动问题。
其中,EE问题全称为Exploit-Explore问题,在影视作品推荐方法中,有已经确定用户感兴趣的领域,也有不明确用户是否会感兴趣的领域,而如何在推荐的过程中平衡这两种领域的推荐,就是EE问题;冷启动问题是指面对新的用户,如果在尽可能短的时间内,确定用户所感兴趣的大致方向。
多臂老虎机算法本身是在探索和开发之间做平衡的算法,它量化了错误的选择到底带来了多大的遗憾,现有的多臂老虎机算法,忽略了上下文相关的信息,而这正是推荐方法中十分重要的部分,同时,传统的推荐方法算法中往往离不开协同过滤,如何利用多臂老虎机算法和协同过滤的思想,也是一大技术问题。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于多臂老虎机算法的影视作品推荐方法。
本发明的目的可以通过以下技术方案来实现:
一种基于多臂老虎机算法的影视作品推荐方法,包括以下步骤:
1)获取每个影视作品和当前待推荐用户的特征表示,获得初始的作品聚类和用户聚类;
2)遍历所有影视作品,计算对应的预估计回报,选取预估计回报最大的推荐给待推荐用户;
3)待推荐用户在接收到推荐后,做出真实反馈;
4)基于用户真实反馈更新聚类和预估计回报模型,调整模型中部分超参数,并重新推荐。
所述的步骤1)具体包括以下步骤:
11)通过特征抽取模型获取所有作品的特征表示Xa,0以及当前待推荐用户的特征表示Ui,0;
12)初始化作品聚类和用户聚类,将所有的影视作品和待推荐用户分别归为一类,并分别获取每个聚类的特征向量均值作为对应聚类的特征中心;
13)在初始化的作品聚类和用户聚类之间建立连接,并记录在聚类记录文件中。
所述的步骤11)中,将每个作品的题目、标签和简介以文本的形式作为输入,通过特征抽取模型E获取每个作品a的特征表示Xa,0,即作品特征向量,并且以当前待推荐用户的兴趣信息、历史观看和反馈记录以作为输入,通过特征抽取模型E获取当前待推荐用户i的特征表示Ui,0,即用户特征向量。
所述的步骤12)中,当加入新的用户或影视作品时,按照其特征向量将其归类至与其距离最近的聚类中,并更新聚类记录文件,其中,距离具体为特征向量与聚类的特征中心的欧氏距离。
所述的步骤2)具体包括以下步骤:
21)获取所有与当前待推荐用户i有连接关系的作品聚类,记为集合I={A|U→A,i∈U},其中,i∈U表示当前待推荐用户i所在的用户聚类为U,U→A表示作品聚类A和用户聚类A之间存在连接关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110091259.1/2.html,转载请声明来源钻瓜专利网。