[发明专利]一种多指标评价信息的数据挖掘方法有效
申请号: | 201210116561.9 | 申请日: | 2012-04-19 |
公开(公告)号: | CN103377296A | 公开(公告)日: | 2013-10-30 |
发明(设计)人: | 王劲林;吕红亮;邓峰 | 申请(专利权)人: | 中国科学院声学研究所;上海尚恩华科网络科技股份有限公司 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 指标 评价 信息 数据 挖掘 方法 | ||
技术领域
本发明涉及数据挖掘领域,特别涉及一种多指标评价信息的数据挖掘方法。
背景技术
随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载(Information overload)的时代。数据挖掘领域的个性化推荐技术是用来帮助用户发现内容,克服信息过载的重要技术。
个性化推荐是数据挖掘的一个重要分支,也是当前研究的热点方向。现有的个性化推荐技术解决的主要是单一评分场景下的推荐问题,基于已知的用户对某些物品(比如Netflix的电影和Amazon的书籍)整体印象的评价信息,预测用户对其他物品偏好,并给用户推荐合适的物品。对于此类问题的研究已经相对成熟,主要有:基于内容的推荐方法,基于协作过滤的推荐方法和混合推荐方法。而对于具有多指标评价信息场景下的推荐问题,目前并没有成熟的方法。
多指标推荐问题主要解决已知产品或者服务的多个方面的评价信息,如何预测用户偏好并给用户推荐合适的产品或服务的问题。比如已知用户对酒店的位置,服务,卫生和整体印象等方面的打分评价信息,给用户推荐合适的酒店。如果使用现有的单指标推荐算法,则很难利用所有的打分数据。而多指标推荐方法则可以利用所有的打分数据,从而得出更准确的推荐。
现有的用于实现多指标推荐的数据挖掘方法主要有:融合多个指标相似度作为整体相似度的方法;多维空间距离作为整体相似度的方法;针对各个指标进行预测,然后采用聚集函数的方法。但这些方法均以指标相互独立为前提,有较大的局限性。而多维奇异值分解(Singular value decomposition,SVD)技术采用填充三维矩阵,然后分解的方式,考虑了指标之间的关联,但是本来稀释的打分矩阵经过填充之后增加了大量的数据,造成算法时间和空间复杂度都比较高,不利于在大规模数据场景下使用。
可见,现有数据挖掘方法在多指标推荐应用场景中,无法做到在综合考虑指标间的关联以及降低算法复杂度,且推荐精度也无法满足实际商业应用的需求。
发明内容
本发明的目的在于克服现有的数据挖掘方法算法复杂度高、推荐精度无法满足商业应用的需求等缺陷,从而提供一种复杂度低、精度高的数据挖掘方法。
为了实现上述目的,本发明提供了一种多指标评价信息的数据挖掘方法,包括:
步骤1)、读取已有的交互数据;所述已有的交互数据包括显性的打分数据,所述显性的打分数据包括:一用户在与要打分的物品或服务相类似的已经打过分的其他物品或服务上的打分数据;其他用户之前在要打分的物品或服务上的打分数据;
步骤2)、根据步骤1)得到的已有的交互数据,采用经过训练的关联模型预先计算一用户对某一物品或服务在某一指标上的打分值;其中,所述关联模型包括
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;上海尚恩华科网络科技股份有限公司,未经中国科学院声学研究所;上海尚恩华科网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210116561.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:LED照明灯
- 下一篇:一种声控式带散热介质的大功率LED节能灯杯
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置