[发明专利]一种基于粗糙聚类的社会化推荐方法在审

专利信息
申请号: 201910601112.5 申请日: 2019-07-04
公开(公告)号: CN110309424A 公开(公告)日: 2019-10-08
发明(设计)人: 武庆斌;于海;王敬龙;王一博;高祥 申请(专利权)人: 东北大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/9536;G06K9/62
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 姜玉蓉;李洪福
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 聚类 聚类中心 初始聚类中心 粗糙 余弦相似度 密度函数 权重 算法 近似 集合 最大相似度 计算方式 计算数据 聚类集合 目标用户 欧氏距离 评分矩阵 评分数据 剩余用户 项目集合 项目推荐 影响因子 传统的 粗糙集 自适应 排序 替换 预测 优化 改进
【说明书】:

发明提供一种基于粗糙聚类的社会化推荐方法,包括:将用户的社会化评分数据构造评分矩阵;计算除所述第一个初始聚类中心外的其他的聚类中心,将所述聚类中心按照密度函数从大到小排序后;分别计算每个所述剩余用户到K个聚类中心的余弦相似度及最大相似度进而进行聚类划分;计算非聚类中心用户的权重值wi与聚类集合的近似集合影响因子;根据所述预测评分的高低形成由高至低的推荐项目集合,为目标用户进行项目推荐。本文提出的一种基于粗糙聚类的社会化推荐算法,通过计算数据对象的密度函数对K‑means聚类推荐算法进行改进,优化了初始聚类中心的选取问题,实现了粗糙集上、下近似集合的权重自适应,并采用余弦相似度替换传统的欧氏距离计算方式。

技术领域

本发明涉及数据挖掘技术领域,具体而言,尤其涉及一种基于粗糙聚类的社会化推荐方法。

背景技术

从20实际90年代开始,互联网技术发展及其迅猛。从早期的黄页网站导航阶段到时下的信息搜索引擎阶段,互联网始终紧跟时代主题,不断完善不断突破。在社交网络、电子商务、休闲娱乐等领域,互联网可以满足用户的各类需求。但面对互联网上海量的信息,用户常常会有眼花缭乱的感觉,无法从中获取最有价值的信息。当网络信息过于丰富,超过了用户或相关系统的处理范围,信息过载的问题就产生了。为了解决信息过载问题,帮助用户过滤信息的专业数据索引和搜索引擎等相关工具与应用应运而生,Google、Baidu等搜索引擎已经成为用户每天必不可少的网络工具。但主动搜索往往将部分问题遗留给了用户,为了使用搜索引擎获得更好的检索结果,用户不得不学习一定的专业知识,比如搜索策略等。在这样的背景下,基于推荐引擎的推荐系统成为一种新颖而高效的互联网应用。

推荐系统(Recommender System)是一种软件工具和技术方法,它以数据挖掘、机器学习等技术为基础,通过分析用户数据为用户提供建议及决策。搜索引擎是被动非智能的,需要用户首先明确自己的核心需求,然后执行相关检索操作,最后获得相应检索信息。而推荐系统是主动智能的,首先通过分析用户行为数据来构建用户模型,然后对相关信息进行筛选过滤,最后将适合的信息与服务推荐给用户。推荐系统在解决用户实际需求的同时,还能够引导用户发现自己的潜在需求。对于缺乏个人经验与决策能力的用户,当他们面临大量可供选择的信息而无法抉择的时候,推荐系统可以为其提供最适合的建议。因此,与搜索引擎技术相比,推荐系统已经成为更为重要的信息过载问题解决手段。

互联网正从搜索时代进入推荐时代,随着云计算、大数据、物联网等相关技术的不断发展与成熟,推荐系统将是未来的主流技术。基于用户各类信息数据的不断积累,推荐系统将根据用户的行为习惯和特征属性等相关信息进行分析,为用户提供最有价值的信息,从而为用户的生活带来便利。

聚类分析是数据挖掘技术中的一种重要方法,最早起源于分类学,对事物进行特征分类,后来结合多元分析等相关数学知识发展成为一个独立的研究学科。聚类分析技术在生物学、心理学、考古学、地质学以及市场营销等领域都有重要应用,同时,聚类算法在图像分割、图像识别、信息检索以及推荐系统研究方向上都发挥着重要作用。

K-means算法的思想最早可以追溯到1957年,由Hugo Steinhaus提出。直到1967年,James MacQueen首次将其命名为K-means算法,并给出了算法的流程步骤。K-means算法是基于划分的聚类算法中的典型代表,基本原理是把数据集合按照特定方式划分成K个聚类集合。其具体步骤如下:首先是初始聚类中心的选取,即随机从数据集合中选取K个对象。接着计算其他对象与每个中心之间的关系,并根据关系程度把每个数据对象划分到其关系最强的聚类中心所归属的集合中。之后是对所有聚类中心进行调整,迭代进行如上步骤,当所有聚类中心达到稳定状态时停止调整。最后,得到稳定的聚类结果即K个聚类集合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910601112.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top