[发明专利]一种过滤搜索引擎查询结果的方法有效

专利信息
申请号: 200710118084.9 申请日: 2007-06-28
公开(公告)号: CN101334773A 公开(公告)日: 2008-12-31
发明(设计)人: 范昂 申请(专利权)人: 联想(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京汇泽知识产权代理有限公司 代理人: 张颖玲
地址: 100085*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 过滤 搜索引擎 查询 结果 方法
【权利要求书】:

1.一种过滤搜索引擎查询结果的方法,其特征在于,在用户端设置搜索代 理单元,搜索代理单元设定不同的搜索引擎,用户端通过所述搜索代理单元, 向一个或一个以上搜索引擎发起查询请求,该方法包括以下步骤:

A、通过用户端输入查询关键字,并向所述搜索代理单元发起查询请求;

B、搜索代理单元从所述用户端的当前文本类型操作窗口中提取数据信息 后,在所述查询关键字与用户当前文本类型操作窗口中的所述数据信息之间建 立关联,并将其他从用户当前文本类型操作窗口数据信息中提取的关键信息确 定为附加信息,将相关联的所述查询关键字与所述数据信息以及所述附加信息 相结合,设置为查询条件;根据所述查询条件,所述用户端向所述搜索引擎发 起查询请求;所述搜索引擎将查询结果返回所述用户端,完成用户查询。

2.根据权利要求1所述的方法,其特征在于,其还包括有计算所述搜索引 擎返回的查询结果与提取的所述数据信息之间的相似匹配程度,然后对所述数 据信息进行聚类处理的步骤,所述聚类处理具体包括以下步骤:

X1、对当前操作窗口分类,提取所述操作窗口中的主题数据信息,获得对 应各类操作窗口主题数据信息的向量特征;

X2、计算所述主题数据信息与所述搜索引擎返回的查询结果的相似匹配程 度并聚类;

X3、对聚类得到的每类主题数据信息进行所述向量特征的合并,提取出这 一类主题数据信息的特征向量。

3.根据权利要求2所述的方法,其特征在于,步骤X1中提取所述操作窗 口中的主题数据信息具体采用的算法为:tf×IDF;其中,tf为所述主题数据信 息在所述当前操作窗口出现的频率,以统计方式获得的通用参数IDF为倒排文 献频率。

4.根据权利要求2所述的方法,其特征在于,步骤X2中所述计算相似匹 配程度采用基于向量空间模型VSM的VSM算法,VSM算法具体为:

Sim(wi,vj)=Cosθ=Σk=1nwik.vjkΣk=1nwik2·Σk=1nvjk2;]]>

其中,W、V分别表示一个特征向量;W为从所述主题数据信息中提取出 的向量,V为从所述搜索引擎返回的查询结果中提取出的向量,θ为向量间夹 角。

5.根据权利要求4所述的方法,其特征在于,步骤X2进一步为:

X21、对相似匹配程度计算结果进行精确性校验,计算并获得精确的相似 匹配程度。

6.根据权利要求5所述的方法,其特征在于,所采用的精确性校正函数为:

其中,T为待计算的主题数据信息;C为当前操作窗口中,聚类中心的主 题数据信息;Subjrela为当前操作窗口中,聚类中心主题数据信息的相关系数; R为主题数据信息相关系数;P为向量相似匹配程度精确性校正系数;

则所述精确的相似匹配程度为:Sim(wi,vj)×Ris×Pi

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710118084.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top