[发明专利]基于物品间相似度的物品处理方法、系统和装置有效

专利信息
申请号: 201410158957.9 申请日: 2014-04-18
公开(公告)号: CN103995831B 公开(公告)日: 2017-04-12
发明(设计)人: 刘洋 申请(专利权)人: 新浪网技术(中国)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市京大律师事务所11321 代理人: 张璐,方晓明
地址: 100080 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 物品 相似 处理 方法 系统 装置
【说明书】:

技术领域

发明涉及计算机领域,尤其涉及一种基于物品间相似度的物品处理方法、系统和装置。

背景技术

随着互联网技术迅猛发展,网上信息爆炸式增长,基于特征向量的相似度计算已广泛应用于多个领域。例如,在物品推荐系统中,可将待推荐物品等以特征向量的方式表示,通过计算各待推荐物品的特征向量之间的相似度,建立相似度数据模型;这样,物品推荐系统可根据用户的需求、兴趣等,将用户感兴趣的物品推荐给用户,从而避免信息超载给用户带来的不便。再如,在垃圾邮件过滤系统中,将电子邮件的邮件数据以特征向量表示,通过计算各电子邮件的特征向量之间的相似度,对电子邮件进行分类,以便于垃圾邮件过滤规则的挖掘。为便于描述,在本文中将物品推荐系统中的待推荐物品、垃圾邮件过滤系统中的电子邮件等统称为物品。

在实际应用中,随着物品推荐系统、垃圾邮件过滤系统的不断运行,这些系统中的物品的数量将越来越多。现有技术中当有新增物品时,提取新增物品的特征,进而得到新增物品的特征向量后,分别计算新增物品的特征向量与之前的所有原有物品的特征向量之间的相似度,从而得到当前的全部物品的特征向量间的相似度;从而物品推荐系统可基于得到的物品间相似度进行物品推荐,垃圾邮件过滤系统也可基于得到的物品间相似度进行电子邮件(物品)分类。其中,物品的特征向量间的相似度即表示物品间的相似度。然而,这种方式的计算量较大,每当有新增物品时,需要计算新增物品的特征向量与之前的所有原有物品的特征向量之间的相似度,在原有物品较多的情况下,这种方式的计算量将非常大,占用的计算资源较多,导致相似度更新速度较慢。而且,现有技术中基于物品间相似度进行物品推荐或分类时占用时间较长,使得用户体验较差。

发明内容

针对上述现有技术存在的缺陷,本发明提供了一种基于物品间相似度的物品处理方法、系统和装置,用以加快相似度更新速度,并加快物品处理速度。

本发明实施例提供了一种基于物品间相似度的物品处理方法,包括:

在接收到物品处理指令后,根据所述物品处理指令所涉及的物品的名称,查找物品间相似度列表中以该物品的名称为索引的相似度记录,并根据查找到的相似度记录中所涉及的物品进行物品处理;其中,所述物品间相似度列表是以如下方法进行更新的:

对于新增物品,在提取其特征后,根据提取的特征确定所述新增物品的特征向量;

从以特征为索引的特征列表中查找出与所述新增物品的特征相同的特征后,进一步从所述特征列表中确定查找出的特征所对应的原有物品的名称;

对于确定出的每个原有物品的名称,在所述物品间相似度列表中的、以该原有物品的名称为索引的相似度记录中,存储该原有物品的特征向量与所述新增物品的特征向量间的相似度;并

在所述物品间相似度列表中,创建以所述新增物品的名称为索引的一条相似度记录,并在该相似度记录中存储所述新增物品的特征向量与各确定出的原有物品的特征向量间的相似度。

较佳地,在所述确定所述新增物品的特征向量后,还包括:

对于所述新增物品的每个特征,将该特征与所述特征列表中存储的特征进行比对,若该特征不存在于所述特征列表中,则在所述特征列表中创建以该特征为索引的特征记录后,在该特征记录中存储所述新增物品的名称;以及

所述从以特征为索引的特征列表中查找出与所述新增物品的特征相同的特征后,还包括:

对于查找出的每个特征,在以该特征为索引的特征记录中存储所述新增物品的名称。

其中,所述物品间相似度列表和所述特征列表是预先创建的:

对于预先得到的若干原有物品中的每个原有物品,提取该原有物品的特征后,确定出该原有物品的特征向量;

将各原有物品的特征组成特征集合后,创建所述特征列表;并

对于所述特征集合中的每个特征,在所述特征列表中创建一条以该特征为索引的特征记录,将具有该特征的原有物品的名称存储到该特征记录中;

对于所述特征列表中记录的每个特征,将以该特征为索引的特征记录中所涉及的任意两个原有物品确定为一对原有物品对,计算出该对原有物品的特征向量间的相似度;

创建所述物品间相似度列表后,对于每个原有物品,在所述物品间相似度列表中创建以该原有物品的名称为索引的相似度记录,并在该相似度记录中存储计算出的该原有物品的特征向量与其它原有物品的特征向量间的相似度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410158957.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top