[发明专利]一种多指标评价信息的数据挖掘方法有效

专利信息
申请号: 201210116561.9 申请日: 2012-04-19
公开(公告)号: CN103377296A 公开(公告)日: 2013-10-30
发明(设计)人: 王劲林;吕红亮;邓峰 申请(专利权)人: 中国科学院声学研究所;上海尚恩华科网络科技股份有限公司
主分类号: G06F17/50 分类号: G06F17/50
代理公司: 北京法思腾知识产权代理有限公司 11318 代理人: 杨小蓉;杨青
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 指标 评价 信息 数据 挖掘 方法
【说明书】:

技术领域

发明涉及数据挖掘领域,特别涉及一种多指标评价信息的数据挖掘方法。

背景技术

随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(Information overload)的时代。数据挖掘领域的个性化推荐技术是用来帮助用户发现内容,克服信息过载的重要技术。

个性化推荐是数据挖掘的一个重要分支,也是当前研究的热点方向。现有的个性化推荐技术解决的主要是单一评分场景下的推荐问题,基于已知的用户对某些物品(比如Netflix的电影和Amazon的书籍)整体印象的评价信息,预测用户对其他物品偏好,并给用户推荐合适的物品。对于此类问题的研究已经相对成熟,主要有:基于内容的推荐方法,基于协作过滤的推荐方法和混合推荐方法。而对于具有多指标评价信息场景下的推荐问题,目前并没有成熟的方法。

多指标推荐问题主要解决已知产品或者服务的多个方面的评价信息,如何预测用户偏好并给用户推荐合适的产品或服务的问题。比如已知用户对酒店的位置,服务,卫生和整体印象等方面的打分评价信息,给用户推荐合适的酒店。如果使用现有的单指标推荐算法,则很难利用所有的打分数据。而多指标推荐方法则可以利用所有的打分数据,从而得出更准确的推荐。

现有的用于实现多指标推荐的数据挖掘方法主要有:融合多个指标相似度作为整体相似度的方法;多维空间距离作为整体相似度的方法;针对各个指标进行预测,然后采用聚集函数的方法。但这些方法均以指标相互独立为前提,有较大的局限性。而多维奇异值分解(Singular value decomposition,SVD)技术采用填充三维矩阵,然后分解的方式,考虑了指标之间的关联,但是本来稀释的打分矩阵经过填充之后增加了大量的数据,造成算法时间和空间复杂度都比较高,不利于在大规模数据场景下使用。

可见,现有数据挖掘方法在多指标推荐应用场景中,无法做到在综合考虑指标间的关联以及降低算法复杂度,且推荐精度也无法满足实际商业应用的需求。

发明内容

本发明的目的在于克服现有的数据挖掘方法算法复杂度高、推荐精度无法满足商业应用的需求等缺陷,从而提供一种复杂度低、精度高的数据挖掘方法。

为了实现上述目的,本发明提供了一种多指标评价信息的数据挖掘方法,包括:

步骤1)、读取已有的交互数据;所述已有的交互数据包括显性的打分数据,所述显性的打分数据包括:一用户在与要打分的物品或服务相类似的已经打过分的其他物品或服务上的打分数据;其他用户之前在要打分的物品或服务上的打分数据;

步骤2)、根据步骤1)得到的已有的交互数据,采用经过训练的关联模型预先计算一用户对某一物品或服务在某一指标上的打分值;其中,所述关联模型包括

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;上海尚恩华科网络科技股份有限公司,未经中国科学院声学研究所;上海尚恩华科网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210116561.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top