[发明专利]产品推荐方法及装置在审
申请号: | 202110541094.3 | 申请日: | 2021-05-18 |
公开(公告)号: | CN115374345A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 秦鹏;秦晓飞;王鑫 | 申请(专利权)人: | 中国移动通信集团有限公司;中国移动通信集团山西有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨明月 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 产品 推荐 方法 装置 | ||
本发明提供一种产品推荐方法及装置,该方法包括:对所述目标用户的属性信息进行排序,获取排序结果中位于中间位置的属性信息,将所述排序结果中位于中间位置之前和之后的属性信息分成相同数量的组;根据关于所述中间位置对称的任意两组属性信息和位于所述中间位置的属性信息,构建属性集合,提取每个属性集合的统计特征;将所有属性集合的统计特征作为随机森林模型的输入,输出向所述目标用户推荐的产品。本发明提高了产品推荐的精度和效率。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种产品推荐方法及装置。
背景技术
随着4G和5G的普及、流量资费下降、智能手机全面普及等因素,流量的使用已经超越通话需求,很多通话场景可以通过流量途径解决。运营商现有应对客户流量需求采用的产品推荐方法已严重不能满足目前快速增加的流量需求。
目前,现有的流量产品推荐方法包括聚类方法、随机森林方法、基于贝叶斯(Bayes)的方法和基于神经网络的方法。其中,随机森林方法是在已有的决策树基础理论之上,将多棵决策树分类模型组成一种组合式的分类模型,又称森林。而且每个单独的决策树所依赖的数据样本是独立同分布的,最后通过每棵决策树的共同投票决出分类结果。
在使用随机森林进行流量产品推荐时,直接将原始用户基本属性信息作为随机森林的输入。一般情况下,用户基本属性信息具有一定的关联度,而训练决策树要求属性相互独立,具有一定关联度的用户基本属性信息对决策树精度的影响呈指数变化,导致随机森林分类不准确,推荐效果差。而且随着用户基本属性数量的增加,随机森林的算法复杂度呈指数增加,进而影响决策速度。
发明内容
本发明提供一种产品推荐方法及装置,用以解决现有技术中产品推荐不准确,效率低的缺陷,实现提升产品推荐的准确性和效率。
本发明提供一种产品推荐方法,包括:
对目标用户的属性信息进行排序,获取排序结果中位于中间位置的属性信息,将所述排序结果中位于中间位置之前和之后的属性信息分成相同数量的组;
根据关于所述中间位置对称的任意两组属性信息和位于所述中间位置的属性信息,构建属性集合,提取每个属性集合的统计特征;
将所有属性集合的统计特征作为随机森林模型的输入,输出向所述目标用户推荐的产品;
其中,所述随机森林模型通过以第一样本用户的属性信息为训练样本,以所述第一样本用户历史查询或使用过的产品为标签训练得到。
根据本发明提供一种的产品推荐方法,所述将所有属性集合的统计特征作为随机森林模型的输入,输出向所述目标用户推荐的产品,包括:
计算所述随机森林模型中当前已使用的每个决策树为产品投票的概率在预设置信区间的置信度;
在所述置信度大于第一预设阈值,或者小于等于1减去所述第一预设阈值的情况下,基于当前已使用的决策树获取向所述目标用户推荐的产品。
根据本发明提供的一种产品推荐方法,所述随机森林模型中当前已使用的每个决策树为产品投票的概率通过以下公式获取:
其中,P为每个产品对应的概率分布,p为每个决策树推荐该产品的概率,h为推荐该产品的分类器的数量,α为当前已使用的决策树的数量,a为所述预设置信区间内的最小值,n为整数。
根据本发明提供的一种产品推荐方法,所述基于当前已使用的决策树获取向所述目标用户推荐的产品,包括:
计算当前已使用的所有决策树为每个产品投票的概率在预设置信区间的置信度平均值;
将所述置信度平均值最高的预设个数的产品作为向所述目标用户推荐的产品。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团有限公司;中国移动通信集团山西有限公司,未经中国移动通信集团有限公司;中国移动通信集团山西有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110541094.3/2.html,转载请声明来源钻瓜专利网。