[发明专利]一种基于粗糙聚类的社会化推荐方法在审
| 申请号: | 201910601112.5 | 申请日: | 2019-07-04 |
| 公开(公告)号: | CN110309424A | 公开(公告)日: | 2019-10-08 |
| 发明(设计)人: | 武庆斌;于海;王敬龙;王一博;高祥 | 申请(专利权)人: | 东北大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06K9/62 |
| 代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
| 地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 聚类 聚类中心 初始聚类中心 粗糙 余弦相似度 密度函数 权重 算法 近似 集合 最大相似度 计算方式 计算数据 聚类集合 目标用户 欧氏距离 评分矩阵 评分数据 剩余用户 项目集合 项目推荐 影响因子 传统的 粗糙集 自适应 排序 替换 预测 优化 改进 | ||
1.一种基于粗糙聚类的社会化推荐方法,其特征在于,包括以下步骤:
S1:将用户的社会化评分数据,以横坐为标属性纵坐标为所述评分构造一个二维的评分矩阵,为;
其中,U={u1,u2,...,um}表示数量为m的用户集合,T={t1,t2,...,tn}表示数量为n的评测项目集合,ratingij表示用户uj对于项目ti的评分;
S2:根据公式(1)计算所述用户的密度函数f(ui),选取密度最大的用户作为第一个初始聚类中心;根据公式(3)进行计算除所述第一个初始聚类中心外的其他的聚类中心,将所述聚类中心按照密度函数从大到小排序后,从最大的开始依次选取,密度最大且距聚类中心距离最远的用户作为其他初始聚类中心,选取K个初始聚类中心构成聚类集合C,分别记为C={c1,c2,…,ck};
其中,sim(xi,xj)表示两个数据对象之间的余弦相似度,表示为:
其中分别表示用户ui和uj对项目tl的评分,分别表示用户ui和uj的平均评分,表示用户ui和uj同时给予评分的项目集合;R表示数据对象xi所在邻域的有效半径,则对于领域半径的为:
其中,ck表示已经确定的聚类中心,m表示ck的数目,sim(xj,ck)表示数据对象xj与ck的余弦相似度随着所述初始聚类中心的依次选取,m值逐渐增加;当K个初始聚类中心全部选取,则m=K;
S3:对于未被选择的剩余用户,分别计算每个所述剩余用户到K个聚类中心的余弦相似度并通过所述公式(2)求得其中的最大相似度;
S4:分别计算所述未被选择的剩余用户到每个聚类中心的余弦相似度差|sim(uI,cj)-simmax)|,并根据所述余弦相似度差与自定义阈值Sthreshold的关系进行聚类划分;
S5:根据公式(4)-公式(6)分别计算非聚类中心用户的权重值wi与聚类集合的近似集合影响因子,根据公式(7)分别重新计算每个聚类集合的聚类中心ci;
其中,表示xi所在聚类集合的下近似集合,表示xi所在聚类集合的边界集合;wlower和wupper分别表示上、下近似集合的预设的权重;则xi所在集合的影响因子为:
其中表示xi所在下近似集合中数据对象的数目;fupper表示边界集合的影响因子,表示xi所在边界集合中数据对象的数目;
S6:重复步骤S3-步骤S5,直至新的聚类中心与原聚类中心相等或准则函数收敛;
S7:在目标用户所在的聚类集合中计算所述目标用户与其他用户之间的相似度,在所述所在的聚类集合的下近似集合与上近似集合中获得目标用户的近邻集合V;
S8:以所述目标用户的近邻用户的项目评分为基础,对目标用户的未评分项目的评分进行预测评分;
S9:根据所述预测评分的高低形成由高至低的推荐项目集合,为目标用户进行项目推荐。
2.根据权利要求1所述的一种基于粗糙聚类的社会化推荐方法,其特征在于,所述步骤S3具体包括以下步骤:
S31:当|sim(uI,cj)-simmax)|>Sthreshold,则将用户划分到相似度最大的聚类中心所在聚类集合的下近似集合中;
S32:当|sim(uI,cj)-simmax)|≤Sthreshold,则将用户划分到相似度最大的聚类中心所在聚类集合的上近似集合中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910601112.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种敏感信息识别方法、装置及电子设备
- 下一篇:用于存储数据的方法和装置





