[发明专利]一种资源排序方法及装置无效
| 申请号: | 200710175364.3 | 申请日: | 2007-09-28 |
| 公开(公告)号: | CN101398833A | 公开(公告)日: | 2009-04-01 |
| 发明(设计)人: | 崔兴华;赵晓睿 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京汇泽知识产权代理有限公司 | 代理人: | 吴晓磊 |
| 地址: | 100085*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 资源 排序 方法 装置 | ||
技术领域
本发明涉及计算机技术,特别是指一种资源排序方法及装置。
背景技术
随着搜索引擎的不断发展,用户可通过搜索引擎轻松地查找到自身感兴趣的网页。目前普遍采用的搜索技术主要包括语义分析和关键字技术、网页级别(PageRank)技术和特征提取与匹配技术。
语义分析和关键字技术主要是基于语义分析和关键字进行搜索,但这样的查询技术并不能完全涵盖资源间的复杂关系,资源间的有些关系并不是基于语义的,而且搜索结果的精确程度取决于对语义分析算法的要求,语义分析的人工智能化程度还比较低,常常会出现答非所问的搜索结果,目前还没有比较好的实现方式。
PageRank是用于评测一个网页“重要性”的一种方法,在揉合了诸如主题(Title)标识和关键词(Keywords)标识等其他因素后,通过PageRank来调整结果排序,使那些更具“重要性”的网页在搜索结果中排在靠前的位置,从而提高搜索结果的相关性和质量,但是,PageRank只引入了一维的链接推荐来分析网页资源间的关系,仅考虑了网页重要性的纵向关系,却没有考虑网页间的横向关系,而网页间的横向关系也是非常重要的。
特征提取与匹配是通过对资源样本进行分析,提取出特征信息,比如词条的文档频率,信息增益等,然后根据与目标资源的匹配情况来进行搜索或资源推荐。特征提取算法一般比较复杂,对某种特定的资源都需要根据语义分析特征值,并且智能匹配的要求不容易实现。
综上所述,现有的搜索和相关推荐技术大都是基于语义的,但网页之间的联系有很多根本不是基于语义的,在这样的情况下,基于现有的分析技术很难确定资源之间非语义的其他联系。
发明内容
有鉴于此,本发明的主要目的在于提供一种资源排序方法及装置,以根据资源之间的非语义相关性对资源进行排序。
为达到上述目的,本发明的技术方案是这样实现的:
一种资源排序方法,该方法包含:提取不同资源组中的资源元素构建矩阵,在矩阵中确定资源组中各资源元素之间的相关性值;根据所得相关性值对资源进行排序。
所述构建矩阵之前,进一步包括:将资源依照设定的标准或方法划分为至少一个资源组。
所述构建矩阵确定相关性值,包括:提取一个资源组中的各资源元素,根据该资源组中的资源元素的数量建立矩阵,计算资源组中任两个资源元素之间的相关性值,填入矩阵中这两个元素所对应的行列交叉处;判断是否还有资源组未进行扫描,如果是,则对未处理的一个资源组中的各资源元素进行扫描,确定任两个资源元素之间的相关性值,然后返回执行所述判断步骤,否则,结束当前流程。
所述提取资源元素计算相关性值,包括:首先,建立一个空矩阵及空集合P,集合N为当前资源组集合,对集合N中的元素进行扫描,选择当前元素,在方形矩阵中增加一行和一列,新增行和列的各元素值均为0,然后计算当前元素与集合P中所有元素的相关性值,填入当前元素所代表的行和列与各元素所代表的列和行的交叉处,然后将当前元素从集合N移动至集合P,并从集合N中删除当前元素,扫描集合N中的下一个元素,将该元素作为当前元素,重复上述过程,直至集合N为空。
所述判断是否还有资源组未进行扫描,包括:判断当前资源元素是否是矩阵中尚没有的资源元素,如果有,则更新矩阵中已有元素之间的相关性值,如果没有,则计算该资源元素与矩阵中其它元素的相关性值,填入矩阵中当前元素与相应元素所对应的行列交叉处,选择下一当前资源元素,返回执行所述判断。
所述计算相关性值,包括:在方形矩阵中增加一行和一列,计算当前元素与矩阵中所有元素的相关性值,填入当前元素所代表的行和列与相应元素所代表的列和行的交叉处。
所述更新相关性值,包括:直接计算当前元素与矩阵中所有元素的相关性值,填入当前元素所代表的行和列与相应元素所代表的列和行的交叉处。
所述判断当前资源元素是否是矩阵中尚没有的资源元素之前,进一步包括:设置空集合P,将集合N设置为当前资源组集合;
所述选择下一当前资源元素或更新相关性值之后进一步包括:将当前元素从集合N移动至集合P,并从集合N中删除当前元素,扫描集合N中的下一个元素,将该元素作为当前元素,重复所述判断步骤,直至集合N为空。
所述相关性值与表示资源组所在的维度对最终结果影响大小的权值相关。
所述确定相关性值,之后进一步包括:计算矩阵上三角阵的平均值,并计算向量夹角余弦,根据平均值及向量夹角余弦对所述权值进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710175364.3/2.html,转载请声明来源钻瓜专利网。





