[发明专利]游戏商品的推荐方法、装置及可读存储介质有效
申请号: | 201910406926.3 | 申请日: | 2019-05-15 |
公开(公告)号: | CN110135951B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 杜鑫 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张子青;刘芳 |
地址: | 310052 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 游戏 商品 推荐 方法 装置 可读 存储 介质 | ||
本发明提供的游戏商品的推荐方法、装置及可读存储介质,通过获取玩家浏览的当前游戏商品的各属性特征向量,以及玩家自身的特征向量,构成玩家的当前状态集;将所述玩家的当前状态集输入强化学习算法模型,以使所述强化学习算法模型调用的玩家自身的特征向量相应的属性预测矩阵集合,输出各属性预测特征向量;将与各属性预测特征向量匹配的游戏商品作为推荐游戏商品并进行推荐,从而使得在为玩家推荐游戏商品时,所使用的强化学习算法模型综合考虑玩家浏览的历史游戏商品以及浏览的当前游戏商品对推荐游戏商品造成的因素,以为玩家推荐能满足其真实需求的游戏商品。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种游戏商品的推荐方法、装置及可读存储介质。
背景技术
随着计算机技术的发展,利用数据分析技术为用户提供更精准的商品推荐服务成为可能。特别的,在游戏领域,与普通商品不同的是,游戏商品的属性更为多样化,这也使得如何为玩家推荐更为精准的游戏商品成为难题。
现有技术中,一般是基于聚类算法实现为玩家推荐游戏商品的,通过利用距离算法分析玩家浏览的当前游戏商品与其他游戏商品之间的距离,进而从中找到与该当前游戏商品最为相似的游戏商品,以作为推荐游戏商品进行推荐。
但是,在上述基于聚类算法实现的对游戏商品的推荐,尽管能够使得推荐的游戏商品在整体属性上与玩家浏览的当前游戏商品的保持较高的相似度,但考虑到游戏商品的属性更为多样化,玩家对于游戏商品的某一子属性更为倚重。即,推荐的游戏商品没有考虑到玩家实际所关注的当前游戏商品子属性,这将使得推荐的游戏商品并不能与玩家的实际需求匹配。
发明内容
为了解决上述提及的问题,本发明提供了一种游戏商品的推荐方法、装置及可读存储介质。
一方面,本发明提供了一种游戏商品的推荐方法,包括:
获取玩家浏览的当前游戏商品的各属性特征向量,以及玩家自身的特征向量,构成玩家的当前状态集;
将所述玩家的当前状态集输入强化学习算法模型,以使所述强化学习算法模型调用玩家的当前状态集相应的属性预测矩阵集合,输出各属性预测特征向量;其中,所述属性预测矩阵集合是所述强化学习算法模型根据玩家浏览的历史游戏商品的各属性特征向量确定的;
将与各属性预测特征向量匹配的游戏商品作为推荐游戏商品并进行推荐。
在其中一种可选的实施方式中,所述将所述玩家的当前状态集输入强化学习算法模型之前,还包括:
判断所述玩家是否触发对游戏商品的推荐请求;
若是,则执行所述将所述玩家的当前状态集输入强化学习算法模型的步骤。
在其中一种可选的实施方式中,当所述玩家未触发对游戏商品的推荐请求时,所述游戏商品的推荐方法还包括:
获取玩家对当前游戏商品的行为,并调用所述玩家的上一状态集;其中,所述上一状态集中包括有玩家浏览的上一游戏商品的各属性特征向量;
将所述玩家的上一状态集、当前状态集输入强化学习算法模型,以使所述强化学习算法模型将所述对当前游戏商品的行为作为模型奖励,对所述强化学习算法模型中与玩家相应的属性预测矩阵集合进行更新。
在其中一种可选的实施方式中,所述将所述玩家的上一状态集、当前状态集输入强化学习算法模型,以使所述强化学习算法模型将所述对当前游戏商品的行为作为模型奖励,对所述强化学习算法模型中与玩家相应的属性预测矩阵集合进行更新,包括:
在预设的奖励函数中确定所述对当前游戏商品的行为作所对应的奖励值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910406926.3/2.html,转载请声明来源钻瓜专利网。