[发明专利]用于帖子召回的方法、计算设备和存储介质在审
申请号: | 202210349370.0 | 申请日: | 2022-04-01 |
公开(公告)号: | CN114881114A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 唐方爽;张璐;陶明;彭飞;唐文斌 | 申请(专利权)人: | 上海任意门科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/901;G06F16/9536;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 张平 |
地址: | 201203 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 帖子 召回 方法 计算 设备 存储 介质 | ||
本公开的实施例涉及用于帖子召回的方法、计算设备和计算机存储介质。该方法包括:获取预定时间间隔内的用户针对帖子的第一互动行为数据、以及用户之间的第二互动行为数据、用户标识和帖子标识;生成有向图,有向图指示多个用户节点、多个帖子节点、用于指示第一互动行为的有向边、以及用于指示第二互动行为的有向边;在有向图上,以交替的方式随机游走,以便采集多个节点序列,以用于生成输入特征序列;利用预定尺寸的窗口滑过输入特征序列,以便生成多个子序列以用于训练神经网络模型;经由经训练的神经网络模型,生成用户嵌入表征向量和帖子嵌入表征向量,以便召回关于当前用户的帖子。本公开能够有效提高召回的高相关性的帖子的数量。
技术领域
本公开的实施例总体涉及信息处理领域,具体涉及用于帖子召回的方法、计算设备和计算机存储介质。
背景技术
传统的用于帖子召回的方案例如包括两种:一种是基于用户画像的帖子的召回方法,另一种是基于用户协同过滤(User-CF)的算法进行帖子召回的方法。对于前者,由于用户行为数据通常较为稀疏,难以准确形成用户画像以用于召回帖子。对于后者的协同过滤算法,由于模型仅能学习到用户针对帖子的点赞或关注等行为的一级关系,因此学习能力不理想,所召回的帖子的数量较少并且相关性较低。
综上,传统的用于帖子召回的方案的不足之处在于,难以有效提高召回的高相关性的帖子的数量。
发明内容
提供了一种用于帖子召回的方法、计算设备以及计算机存储介质,能够有效提高召回的高相关性的帖子的数量。
根据本公开的第一方面,提供了一种用于帖子召回的方法。该方法包括:获取预定时间间隔内的用户针对帖子的第一互动行为数据、以及用户之间的第二互动行为数据、用户标识和帖子标识;基于第一互动行为数据、第二互动行为数据、用户标识和帖子标识,生成有向图,有向图指示多个用户节点、多个帖子节点、用于指示第一互动行为的用户节点到帖子节点的有向边、以及用于指示第二互动行为的用户节点之间的有向边;在有向图上,以顺着有向边方向和逆着有向边方向交替的方式随机游走,以便采集长度小于或者等于预定长度阈值的多个节点序列,以用于基于多个节点序列生成输入特征序列;利用预定尺寸的窗口滑过输入特征序列,以便生成多个子序列以用于训练神经网络模型;经由经训练的神经网络模型,生成用户嵌入表征向量和帖子嵌入表征向量,以便基于关于用户嵌入表征向量和帖子嵌入表征向量的相关度计算结果来召回关于当前用户的帖子。
根据本公开的第二方面,提供了一种计算设备。该计算设备包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据第一方面的方法。
在本公开的第三方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
在一些实施例中,在有向图上以顺着有向边方向和逆着有向边方向交替的方式随机游走,以便采集长度小于或者等于预定长度阈值的多个节点序列包括:针对用户节点到帖子节点的有向边的每种属性类型,从有向图中随机采样第一数量的长度不超过第一长度阈值的节点序列;以及针对用户节点之间的有向边的每种属性类型,从有向图中随机采样第二数量个长度不超过第二长度阈值的节点序列。
在一些实施例中,窗口的预定尺寸的是经由以下而确定的:响应于确定用户节点到帖子节点的有向边的属性类型为点击,确定窗口的预定尺寸为第一预定值,以及确定预定长度阈值为第一阈值;以及响应于确定用户节点到帖子节点的有向边的属性类型为评论或者点赞,确定窗口的预定尺寸为第二预定值,以及确定预定长度阈值为第二阈值,第二预定值大于第一预定值,第二阈值大于第一阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海任意门科技有限公司,未经上海任意门科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210349370.0/2.html,转载请声明来源钻瓜专利网。