[发明专利]一种基于多臂老虎机算法的影视作品推荐方法有效
申请号: | 202110091259.1 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112733004B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 张轶飞;程帆;张冬梅 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06N3/04 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 老虎机 算法 影视作品 推荐 方法 | ||
1.一种基于多臂老虎机算法的影视作品推荐方法,其特征在于,包括以下步骤:
1)获取每个影视作品和当前待推荐用户的特征表示,获得初始的作品聚类和用户聚类,具体包括以下步骤:
11)通过特征抽取模型获取所有作品的特征表示Xa,0以及当前待推荐用户的特征表示Ui,0;
12)初始化作品聚类和用户聚类,将所有的影视作品和待推荐用户分别归为一类,并分别获取每个聚类的特征向量均值作为对应聚类的特征中心;
13)在初始化的作品聚类和用户聚类之间建立连接,并记录在聚类记录文件中;
2)遍历所有影视作品,计算对应的预估计回报,选取预估计回报最大的推荐给待推荐用户;
3)待推荐用户在接收到推荐后,做出真实反馈;
4)基于用户真实反馈更新聚类和预估计回报模型,调整模型中部分超参数,并重新推荐。
2.根据权利要求1所述的一种基于多臂老虎机算法的影视作品推荐方法,其特征在于,所述的步骤11)中,将每个作品的题目、标签和简介以文本的形式作为输入,通过特征抽取模型E获取每个作品a的特征表示Xa,0,即作品特征向量,并且以当前待推荐用户的兴趣信息、历史观看和反馈记录以作为输入,通过特征抽取模型E获取当前待推荐用户i的特征表示Ui,0,即用户特征向量。
3.根据权利要求1所述的一种基于多臂老虎机算法的影视作品推荐方法,其特征在于,所述的步骤12)中,当加入新的用户或影视作品时,按照其特征向量将其归类至与其距离最近的聚类中,并更新聚类记录文件,其中,距离具体为特征向量与聚类的特征中心的欧氏距离。
4.根据权利要求1所述的一种基于多臂老虎机算法的影视作品推荐方法,其特征在于,所述的步骤2)具体包括以下步骤:
21)获取所有与当前待推荐用户i有连接关系的作品聚类,记为集合I={A|U→A,i∈U},其中,i∈U表示当前待推荐用户i所在的用户聚类为U,U→A表示作品聚类A和用户聚类A之间存在连接关系;
22)根据预估计回报模型计算当前时刻t的预估计回报pa,t,则有:
其中,θa为中间参量,Aa为作品a对应的特征矩阵且初始化为单位阵,ba为作品a对应的特征偏置且初始化为零向量,Xa,t为当前时刻t作品a的特征表示,α为设定的探索参数,用以控制为用户推荐未看过品类的影视作品数量;
23)在所有预估计回报最高的作品中随机选出一个作品at推荐给当前待推荐用户,则有:
at=arg max pa,t。
5.根据权利要求4所述的一种基于多臂老虎机算法的影视作品推荐方法,其特征在于,所述的步骤3)具体为:
收集所有当前待推荐用户包括点击情况、点赞情况和评价情况的反馈信息,其中,对于点击情况和点赞情况采取分别记分的方式打分,对于评价情况,则采用CNN-LSTM架构的情感分析模型进行打分,将三种情况的打分求和得到前待推荐用户对当前推荐作品的打分ri,t。
6.根据权利要求5所述的一种基于多臂老虎机算法的影视作品推荐方法,其特征在于,所述的步骤4)具体包括以下步骤:
41)根据打分ri,t更新预估计回报模型中的参数;
42)根据打分ri,t更新用户聚类;
43)更新过用户聚类后更新作品聚类;
44)若用户仍有需求,则返回步骤2)重新为用户提供新的推荐作品;
45)根据实际情况,调整探索参数α,增大探索参数α则会为用户推荐更多用户未看过品类的作品,减小探索参数α则会为用户减少未看过品类的推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110091259.1/1.html,转载请声明来源钻瓜专利网。