[发明专利]冷启动方法、装置、计算设备及计算机可读存储介质有效
申请号: | 201810385025.6 | 申请日: | 2018-04-26 |
公开(公告)号: | CN108804517B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 周建斌;颜维平;刘发帅 | 申请(专利权)人: | 北京五八信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 齐洁茹 |
地址: | 100083 北京市海淀区学清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 冷启动 方法 装置 计算 设备 计算机 可读 存储 介质 | ||
本发明公开了一种冷启动方法、装置、计算设备及计算机可读存储介质,其中,该方法包括:根据在先收集的多个用户浏览的内容样本,训练第一内容的每个类别属性到第二内容的每个类别属性的映射关系;利用映射关系,将目标用户浏览的第一内容的类别属性映射到第二内容的类别属性;根据映射到的第二内容的类别属性,确定冷启动的推荐内容。本方案使用的信息容易采集、推荐内容丰富、以及计算量小,由此解决了对没有资讯行为的用户进行个性化资讯推荐的技术问题,并取得了积极的技术效果。
技术领域
本发明涉及数据处理领域,尤其涉及一种冷启动方法、装置、计算设备及计算机可读存储介质。
背景技术
个性化资讯推荐系统,通常的做法是通过用户对资讯的阅读行为和转发、分享、点赞、点踩等互动行为,来建立用户的资讯兴趣模型,使用基于内容的推荐和基于协同过滤的推荐算法计算出用户感兴趣的内容。然而对于没有访问过资讯的用户,我们没有这些用户对资讯的阅读、转发、点赞、等等行为,所以无法用常规方法给这种用户建立兴趣模型和更新兴趣模型,因此给这种没有资讯行为的用户进行个性化资讯推荐就变成了个性化资讯推荐系统的一个难题。这个难题就是个性化资讯推荐中的冷启动问题。
现有解决冷启动问题的主要方法主要分两种:一,根据一些用户的固有属性,比如手机型号、性别、年龄等固有信息,来进行资讯的推荐;二,根据用户的非资讯行为计算用户的相似性,来推荐相似用户看过的资讯。
以上现有的方法,各有各的缺陷,按照用户的固有属性来推荐,会出现固有属性较少,固有属性不容易获得,推荐结果较单一的情况。按照用户相似性计算,则当用户数量多时会产生计算量增长非常快,通常成平方增长或其他非线性的方式增长。
所以,如何解决现有技术中冷启动内容推荐存在的缺陷,成为目前亟待解决的技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种解决上述问题的冷启动方法、装置、计算设备及计算机可读存储介质。
依据本发明的一个方面,提供一种冷启动方法,包括:
根据在先收集的多个用户浏览的内容样本,训练第一内容的每个类别属性到第二内容的每个类别属性的映射关系;
利用映射关系,将目标用户浏览的第一内容的类别属性映射到第二内容的类别属性;
根据映射到的第二内容的类别属性,确定冷启动的推荐内容。
可选的,在训练第一内容的每个类别属性到第二内容的每个类别属性的映射关系之前,还包括:
获取每个用户在浏览第一内容或第二内容时记录的内容的类别属性日志;
按照用户,对日志进行聚合处理,并剔除无效日志,得到内容样本。
可选的,训练第一内容的每个类别属性到第二内容的每个类别属性的映射关系,包括:
根据内容样本,按照预设的权重算法,求取第一内容的类别属性i到第二内容的类别属性j的权重,并将求取的权重作为第一内容的类别属性i到第二内容的类别属性j的映射关系训练结果;其中,i=1,2,…,m;j=1,2,…,n;m为第一内容的类别属性的总个数,n为第二内容的类别属性的总个数。
可选的,权重算法包括:
Wij=log(N*Pij/(Pi*Pj));
式中,Wij表示第一内容的类别属性i到第二内容的类别属性j的权重;N表示既浏览过第一内容又浏览过第二内容的用户数;Pij表示浏览过类别属性为类别属性i的第一内容并且浏览过类别属性为类别属性j的第二内容的用户数;Pi表示浏览过类别属性为类别属性i的第一内容并且浏览过任意类别属性的第二内容的用户数;Pj表示浏览过类别属性为类别属性j的第二内容并且浏览过任意类别属性的第一内容的人数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京五八信息技术有限公司,未经北京五八信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810385025.6/2.html,转载请声明来源钻瓜专利网。