[发明专利]一种解决协同过滤推荐技术中冷启动问题的方法及系统有效
申请号: | 201710634135.7 | 申请日: | 2017-07-29 |
公开(公告)号: | CN107391713B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 田保军;胡培培;杜晓娟;杨浒昀 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06N3/12 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 陈勇 |
地址: | 010051 内蒙古*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 解决 协同 过滤 推荐 技术 冷启动 问题 方法 系统 | ||
本发明属于个性化推荐技术领域,尤其涉及一种解决协同过滤推荐技术中冷启动问题的方法及系统。一种解决协同过滤推荐技术中冷启动问题的方法,包括:选取数据集;通过优化的遗传算法建立初始用户或项目聚类模型;基于用户或项目初始聚类模型进行聚类,得到用户或项目聚类模型;计算新用户或新项目到聚类模型中各类簇的熵值,将新用户或新项目划分类簇;对新用户或新项目进行推荐。本发明还包括一种解决协同过滤推荐技术中冷启动问题的系统,包括:选取模块;初始模型建立模块;聚类模块;划分类簇模块;产生推荐模块。本发明利用改进的遗传算法进行K‑Means聚类,生成用户或项目初始聚类模型,对新用户或新项目产生推荐。
技术领域
本发明属于个性化推荐技术领域,尤其涉及一种解决协同过滤推荐技术中冷启动问题的方法及系统。
背景技术
信息过载是大数据环境下最严重的问题之一,推荐系统作为有效缓解该问题的方法,受到工业界和学术界越来越多的关注。作为当前使用最广泛的推荐技术之一的协同过滤推荐技术,在理论和应用研究都已取得了大量成果,但是存在冷启动问题,影响了协同过滤推荐技术的推荐质量。
冷启动问题包括新用户冷启动问题和新项目冷启动问题。传统的协同过滤推荐技术无法对新用户或新项目进行相似度计算,为其查找最近邻居集,无法产生推荐。本发明借用机器学习思想,采用K-Means算法进行聚类,然后利用新用户或新项目的属性信息,将新用户或新项目分到相应的簇中,这样新用户和新项目就能找到兴趣相似的邻居,根据邻居用户或项目的评分信息产生推荐,解决了传统协同过滤推荐算法的冷启动问题。但是,传统的K-Means聚类算法在对初始用户中心点的选取是随机的,不仅效率低而且会产生局部最优的情况,影响最终聚类的划分,从而影响整个推荐质量。传统的遗传算法中的选择交叉概率及变异概率是固定的,即整个进化过程中不变,但是种群初期与末期的差异是很大的,在种群进化初期,个体之间差异性较大,需要较大的交叉、变异概率,从而增加种群的多样性,而在种群进化的末期,个体之间差异已经相对很小,故需要及时调整交叉概率及变异概率。
发明内容
本发明的目的在于克服上述协同过滤推荐技术中的新用户及新项目冷启动问题,利用改进的遗传算法进行K-Means聚类,生成用户或项目初始聚类模型,最终对新用户和新项目产生推荐。
为了实现上述目的,本发明采用以下技术方案:
一种解决协同过滤推荐技术中冷启动问题的方法,包括以下步骤:
步骤1:选取数据集,所述数据集包括用户-项目评分数据及用户或项目属性信息;
步骤2:基于用户-项目评分数据,通过优化的遗传算法建立初始用户或项目聚类模型;
步骤3:根据初始用户或项目聚类模型,对用户-项目评分数据进行K-Means聚类,得到用户或项目聚类模型;
步骤4:根据新用户或新项目的属性信息及用户或项目属性信息,计算新用户或新项目划分到用户或项目聚类模型各类簇的熵值,根据得出的熵值将新用户或新项目划分到所属类簇;步骤5:在新用户或新项目所属类簇中,查找新用户或新项目的最近邻居,对新用户或新项目的最近邻居进行推荐,并将推荐结果作为对新用户或新项目的推荐。
优选地,在所述步骤2之前还包括:
对遗传算法进行优化,包括:
步骤a.采用加权的轮廓系数作为种群中个体的适应度函数:
f=s (3)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710634135.7/2.html,转载请声明来源钻瓜专利网。