[发明专利]一种信息推荐方法、装置及存储介质在审
申请号: | 201910350722.2 | 申请日: | 2019-04-28 |
公开(公告)号: | CN110209928A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 黄博;毕野;吴振宇;王建明 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06K9/62 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类中心 预处理 存储介质 目标用户 项目集合 信息推荐 预测 集合 归一化处理 评测 电子装置 聚类算法 距离最近 时间函数 时间属性 随机选取 项目推荐 依次排列 用户数据 原始数据 预设 排序 | ||
1.一种信息推荐方法,应用于电子装置,其特征在于,该方法包括:
预处理步骤:对所有项目的用户评分原始数据进行预处理;
选择步骤:根据预处理后的数据,利用聚类算法从所有用户中随机选取预设数量的用户作为原聚类中心;
聚类步骤:根据评分用户对每个项目的评测分,采用归一化处理后的时间函数与皮尔逊相关系数结合的公式分别计算每个用户到各个聚类中心的距离,将每个用户归到距离最近的聚类中心对应的集合中,并重新计算得到各个集合的新聚类中心;及
推荐步骤:重复聚类步骤直至新聚类中心与原聚类中心处于相同位置或距离小于指定阈值,根据每个聚类集合中包含的用户数据采用预测评分公式计算出目标用户对每个项目的预测分,按照所述预测分分值大小顺序依次排列所有项目得到推荐项目集合,根据排序顺序将所述项目集合中的项目推荐给用户。
2.如权利要求1所述的信息推荐方法,其特征在于,所述预处理包括:删除对每个项目评分次数多于或者少于预设次数的用户数据,对剩余用户的未评分项目赋予默认评分分值。
3.如权利要求1所述的信息推荐方法,其特征在于,所述时间函数公式如下:
其中,T是已评分项目的时间权重,是某一商品的平均评分时间,T0是当前时间,α是时间衰减参数。
4.如权利要求3所述的信息推荐方法,其特征在于,归一化处理时间函数的公式如下:
其中,data是要做归一化的数据,Xmax是归一化之前的函数的最大值,Xmin是归一化之前的函数的最小值,Ymax是归一化之后的函数的最大值,Ymin是归一化之后的函数的最小值。
5.如权利要求4所述的信息推荐方法,其特征在于,归一化处理后的时间函数与皮尔逊相关系数结合的公式如下:
其中,sim(x,y)是用户到聚类中心的距离,NT=Norm(T,Xmax3,Xmin3,1,0),Xmax1,Xmin1,Xmax2,Xmin2,Xmax3,Xmin3是各个系数的阈值范围,Ymax1,Ymin1,Ymax2,Ymin2,Ymax3,Ymin3是要归一化的阈值,x,y为两个用户,xi,yi为两个用户的共同打分项。
6.如权利要求1所述的信息推荐方法,其特征在于,所述预测评分的公式如下:
其中,Rui表示用户u对项目i的预测评分,m与用户u是相似用户,在同组集合N中,Rmi表示用户m对项目i的实际评分,sim(u,m)表示用户u和m的相似度系数。
7.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中包括信息推荐程序,该信息推荐程序被所述处理器执行时实现如下步骤:
预处理步骤:对所有项目的用户评分原始数据进行预处理;
选择步骤:根据预处理后的数据,利用聚类算法从所有用户中随机选取预设数量的用户作为原聚类中心;
聚类步骤:根据评分用户对每个项目的评测分,采用归一化处理后的时间函数与皮尔逊相关系数结合的公式分别计算每个用户到各个聚类中心的距离,将每个用户归到距离最近的聚类中心对应的集合中,并重新计算得到各个集合的新聚类中心;及
推荐步骤:重复聚类步骤直至新聚类中心与原聚类中心处于相同位置或距离小于指定阈值,根据每个聚类集合中包含的用户数据采用预测评分公式计算出目标用户对每个项目的预测分,按照所述预测分分值大小顺序依次排列所有项目得到推荐项目集合,根据排序顺序将所述项目集合中的项目推荐给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910350722.2/1.html,转载请声明来源钻瓜专利网。