[发明专利]基于上下文对搜索结果重新排序的方法和系统有效

专利信息
申请号: 200810106007.6 申请日: 2008-05-07
公开(公告)号: CN101320382A 公开(公告)日: 2008-12-10
发明(设计)人: 裘钢 申请(专利权)人: 索意互动(北京)信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100089北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 上下文 搜索 结果 重新 排序 方法 系统
【说明书】:

技术领域

发明涉及计算机搜索领域,尤其涉及基于上下文对搜索查询进行 差异化处理的方法和系统。

背景技术

当用户正在浏览一篇文档,该文档关于如何将家里的电器联结成一 个网络时,用户对“home network”这个词条很感兴趣。于是在搜索系 统中对“home network”,但由于这个词条在不同的领域中有不同的意义, 导致获得结果中有大量是关于蜂窝通信的。原因是,该词条在蜂窝通信 领域也有,意思是“归属网络”。

也就是说,现有的搜索技术都是直接对搜索查询进行处理,而不会 考虑相同的搜索查询在不同的上下文语境中有不同的意思。

所以,需要一种技术,对搜索查询进行处理时,能够根据用户当前 关注的内容来对搜索查询进行重排序处理。

发明内容

本发明的目的是提供:一种基于上下文对搜索结果重新排序的方法, 包括:在正在浏览的文档中选择需要搜索的部分作为搜索因子;根据搜 索因子对数据源进行搜索并获得搜索结果;将所选择的搜索因子的上下 文确定为重排序因子;根据获得的重排序因子,计算所述搜索结果中的 文档与重排序因子的语义相关性,根据所述语义相关性,对搜索结果进 行排序;以所述重排序来显示搜索结果。

本发明更进一步的目的是提供:一种计算机程序产品,存储在计算 机可读的介质上,该计算机程序产品具体地包括可读的程序方法,从而 触发计算机执行上述的方法。

本发明更进一步的目的是提供:一种计算机程序,由计算机执行而 实现上述方法。

本发明还有一个目的是提供:一种对搜索结果重新排序的系统,包 括:数据存储装置,用于存储待搜索的数据源;搜索因子选择装置,用于 在正在浏览的文档中选择需要搜索的部分作为搜索因子;搜索装置,根 据搜索因子对数据源进行搜索并获得搜索结果;重排序因子确定装置,用 于将所选择的搜索因子的上下文确定为重排序因子;重排序装置,用于 根据获得的重排序因子,计算所述搜索结果中的文档与重排序因子的相 关性,根据所述相关性,对搜索结果进行排序;显示装置,用于以所述 排序来显示搜索结果。

附图描述

上述内容和其它方面的内容,以及本发明特定优选实施例的特征和 优势将通过结合相应附图的详细说明更加清楚。其中:

图1是关于词条的表现方法和组合方式;

图2是词条-文档(term-document)矩阵;

图3是高维(r维)词条空间投影到低维(k维)词条空间的公式;

图4是词条向量表;

图5是描述了词条和文档在二维空间上的投影关系;

图6如何获得查询请求的向量;

图7是可以实现本发明的网络系统10;

图8是可以实现本发明的通用计算机20;

图9是执行根据本发明实施例的搜索过程的流程图;

图10是图9中的步骤34的一个具体实施例;

图11是根据本发明的一个具体应用实例。

所有附图中,同一附图标记理解为同一单元、特征和结构。

优选实施例描述

说明书中定义的内容如具体的结构和单元,是用于辅助全面理解本 发明的优选实施例的。因此,根据本领域的普通技术对本申请描述的实 施例进行的各种改变和修改都被认为没有脱离本发明的精神范围。同 时,为了清楚和简要,省略了对公知的功能和结构的说明。

在现有技术中有大量关于基于语义搜索的技术,本领域技术人员可 以利用这些技术很容易的构建词条向量,以及文档向量。其中有代表性 的是潜在语义索引模型等技术。下面介绍潜在语义索引的原理,但不代 表本发明一定要构建在潜在语义索引之上,本发明可以应用在所有的基 于语义的搜索技术上。

潜在语义索引的原理

为了能够更加容易的解释LSI原理,下面通过一个具体例子来描述。 设文档由17本书的标题组成。

图1中,有下划线的词表示词条。当然,对于本领域技术人员,存 在很多其他选择词条的规则,可以增加或减少词条的数量,也可以改变 词条的组合方式等。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索意互动(北京)信息技术有限公司,未经索意互动(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810106007.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top