[发明专利]基于电阻网络和稀疏数据预测的协同过滤方法无效
申请号: | 200810062742.1 | 申请日: | 2008-07-01 |
公开(公告)号: | CN101320461A | 公开(公告)日: | 2008-12-10 |
发明(设计)人: | 庄越挺;吴江琴;马骋;张寅 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00 |
代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 张法高 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 电阻 网络 稀疏 数据 预测 协同 过滤 方法 | ||
技术领域
本发明涉及一种基于电阻网络和稀疏数据预测的协同过滤方法,是个性化推荐技术中一个非常重要的研究方向,在数字图书馆,电子商务及社会网络等领域有着广泛的应用。
背景技术
协同过滤基于这样的基本假设:当前用户会喜欢那些和他相似的用户喜欢的东西。对协同过滤的研究是从基于记忆的方法开始的。协同过滤技术的基本思想是通过比较用户过去的兴趣和行为的相似程度,找出和目标用户具有相同或相似兴趣的用户组,再根据他们对资源的评价来预测目标用户的兴趣,达到向目标用户推荐数字资源的目的。协同过滤的本质是根据用户对信息的评价得到用户的兴趣,判断相似用户,从而向用户推荐新信息。在这一过程中,系统作了两次推断:从用户对一些信息的评价推断出用户的兴趣;从用户的兴趣推断出相似用户群。已有的协同过滤系统在这两次推断中所用的信息通常为用户对一些信息条目的显式评价。
这种方法利用整个用户-物品矩阵来生成基于用户或物品相似度的预测。有两种基于记忆的方法:基于用户的协同过滤和基于物品的协同过滤。基于用户的方法首先寻找那些与当前用户有着相似评分风格的用户,这些用户被称为相似用户,然后根据相似用户已有的评分信息来为当前用户进行评分预测。基于物品的方法在想法上与基于用户的方法是一致的。唯一不同的是基于用户的方法是为当前用户寻找相似的用户,而基于物品的方法却是为当前物品寻找相似的物品。无论是基于用户还是基于物品的方法,对相似度的计算都是该算法中的关键步骤。著名的相似度算法包括Pearson Correlation Coefficient(PCC)和Vector Space Similarity(VSS)算法。
与传统文本过滤相比,协同过滤有下列优点:
1)能够过滤难以进行机器自动内容分析(Content based)的信息,像艺术品、音乐。
2)共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述的概念(如信息质量、品味)进行过滤。
3)可以有效的使用其他相似用户的反馈信息,减少用户的反馈量,加快个性化学习的速度。
4)具有推荐新信息的能力。
协同过滤还有很大的不足,这是由协同过滤的本质决定:要获得满意的效果,必须得到准确的用户信息,一般而言,这需要建立在拥有大量的用户信息数据的基础上,所以很难做到。这使得协同过滤技术应用领域较为狭窄(几乎都集中在娱乐方面:音乐、电影......),在更广的领域(如在基于内容过滤相当成功的文本相关性领域)的应用还很不够。
解决的途径不外乎两条:
1)发展信息获取技术:利用各种途径,合理有效的获得、使用更多的用户信息。
2)发展信息挖掘技术:在有限的原始数据中最大程度的找出有用的信息。
虽然基于记忆的协同过滤算法已经被广泛应用在推荐系统中,但是无论是基于用户的还是基于物品的方法,推荐结果的不准确问题依然存在。基于记忆的协同算法会存在这样的问题,根源在于用户-物品矩阵的稀疏性。最近已经提出了很多算法来减轻数据的稀疏性问题。在相似度计算方面,基于PCC的算法虽然被普遍应用,但它还是不能充分利用用户-物品矩阵中的信息,而且该算法需要有相似的用户或物品,在这两者都缺失的情况下就不起作用了。
发明内容
本发明的目的在于针对现有技术存在的不足,提供一种基于电阻网络和系数数据预测的协同过滤方法,能够提高个性化推荐的质量,达到理想的实用效果。
基于电阻网络和稀疏数据预测的协同过滤方法包括如下步骤:
1)通过电阻网络计算用户之间或物品之间的相似度;
2)根据预先设定的标准提取相似用户或物品的集合;
3)对评分矩阵中的稀疏数据进行有选择性地预测;
4)根据实际应用的需要进行评分预测。
所述通过电阻网络计算用户之间或物品之间的相似度步骤:由评分矩阵得到评分图,相似度的计算对应于评分图中的相应节点的电阻距离计算,抽取相应节点的评分子图,使用电导来衡量节点之间的相似度,在两个节点上加上一个单位电压后,这个网络中的电流就等价于总的电导值,设xa=0,xb=1,对于每个节点V,以及它的相邻节点V1~Vk,流入节点V的总电流为0,根据这一点得到以下一组方程:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810062742.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能分解组装操作台
- 下一篇:牵引杆拆装机