[发明专利]一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质有效
申请号: | 201910124337.6 | 申请日: | 2019-02-19 |
公开(公告)号: | CN109977264B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 王璐 | 申请(专利权)人: | 武汉斗鱼鱼乐网络科技有限公司 |
主分类号: | G06F16/732 | 分类号: | G06F16/732 |
代理公司: | 武汉河山金堂专利事务所(普通合伙) 42212 | 代理人: | 胡清堂;陈懿 |
地址: | 430000 湖北省武汉市东湖新技术开发区软件园东路*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 路径 相似 用户 推荐 方法 系统 服务器 存储 介质 | ||
本发明涉及一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质,所述方法通过构建用户与直播间的异构网络,并统计用户观看时长,计算直播间相似度贡献系数,得到用户间的相似度,本方法考虑了观看时长,得到待推荐用户的相似用户,并将相似用户观看的直播间推荐至待推荐用户,能够快速给直播间待推荐用户推荐热门直播。
技术领域
本发明涉及大数据领域,具体涉及一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质。
背景技术
在直播平台上,为了给用户推荐其感兴趣的直播间,通常采用基于用户或者直播间的协同过滤方法,需要计算用户或者直播间之间的相似度,常规的方法是将用户对直播间的观看看成向量,通过计算向量之间的余弦距离计算相似度,采用SimRank基于用户-直播间关系的随机游走方法计算相似度,所述常规方法存在一些问题,直接采用观看向量只考虑了是否观看的关系,没有观看时长对相似度的影响,SimRank运用了图结构,但是在大数据的条件下算法时间复杂度非常高,上述方法并不能解决对大多数用户推荐热门直播的问题。
发明内容
鉴于现有技术存在的问题,本发明的目的是提供一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质,通过构建用户与直播间的异构网络,并统计用户观看时长,计算直播间相似度贡献系数,得到用户间的相似度,根据用户间的相似度,推荐热门直播给用户。
为了实现上述目的,本发明采用的技术方案为一种基于元路径相似度的用户推荐方法,所述方法包括以下步骤:
S1、在直播平台中,建立用户与直播间观看和被观看的异构网络;
S2、基于步骤S1中异构网络,统计用户对直播间的观看时长,并对观看时长进行处理得到观看时长序号;
S3、根据用户在直播间的观看时长,计算用户相似度贡献系数,再根据所述用户相似度贡献系数,计算用户观看所述直播间的相似度贡献系数;
S4、定义异构网络的元路径,并根据元路径、观看时长序号和直播间相似度贡献系数,计算用户间的相似度;
S5、基于用户的协同过滤及用户间的相似度,得到待推荐用户的相似用户,并将相似用户观看的直播间推荐至待推荐用户。
在上述技术方案中,所述步骤S2中,观看时长统计包括以下步骤:
S21、统计时间T内用户u对直播间r的观看时长wur;
S22、将所有的wur取对数去除观看时长分布的长尾,得出lgwur=ln(wur);
S23、将步骤S22中得出的所有lgwur进行从小到大的排序,并进行等频切分,切分后,将lgwur转换为所在切分段数的序号swur。
在上述技术方案中,所述步骤S21中时间T设为7天或30天。
在上述技术方案中,所述步骤S3还包括以下步骤:
S31、将所有的直播间相似度贡献系数初始化为1,即sr=1(r∈R),其中,R为所有直播间的集合;
S32、根据用户的观看时长分配各直播间相似度贡献系数,得到每个用户的相似度贡献系数su为其中,ur是用户u观看的直播间集合,r是其中的任意一个;ru是观看了直播间r的用户集合,u是其中的任意一个;
S33、根据步骤S32得到直播间相似度贡献系数为其中,|ru|是观看了直播间r的用户总数。
在上述技术方案中,所述步骤4中用户间相似度计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼鱼乐网络科技有限公司,未经武汉斗鱼鱼乐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910124337.6/2.html,转载请声明来源钻瓜专利网。