[发明专利]基于网络相关度的查询分类有效
| 申请号: | 201110408165.9 | 申请日: | 2011-12-09 |
| 公开(公告)号: | CN102521341A | 公开(公告)日: | 2012-06-27 |
| 发明(设计)人: | S.苏雷什;R.D.伯格 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 刘鹏;刘鹏 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 网络 相关 查询 分类 | ||
1.一种使用具有处理器、存储器和数据存储子系统的计算系统来确定查询分类的计算机执行的方法,该计算机执行的方法包括:
选择知识域,该知识域包括被分类成属于该知识域的一组种子网域(910);
对于各个种子网域,利用与特定种子网域相关联的过滤器,执行给定查询的过滤网络搜索,以获得针对该种子网域的过滤结果的总数(920);
对于各个种子网域,引用未过滤结果的总数(512);
通过处理器,使用种子网域对应的过滤结果的总数和种子网域对应的未过滤结果的总数,为各个种子网域计算覆盖百分比(930);和
使用各个种子网域的覆盖百分比,计算知识域的平均覆盖百分比(940)。
2.按照权利要求1所述的计算机执行的方法,此外还包括: 选择多个知识域(510)。
3.按照权利要求2所述的计算机执行的方法,此外还包括: 将给定查询分类到包括最高平均覆盖百分比的知识域中(524)。
4.按照权利要求1所述的计算机执行的方法, 其中平均覆盖百分比表示与知识域的相关度水平(720)。
5.按照权利要求1所述的计算机执行的方法,其中有效的平均覆盖百分比超出最小平均覆盖百分比(1050)。
6.按照权利要求5所述的计算机执行的方法, 其中有效的平均覆盖百分比减少向用户返回不期望的结果(1060)。
7.按照权利要求1所述的计算机执行的方法,此外还包括:
对给定查询进行一般的网络搜索(1040);和
确定该一般网络搜索的前面的结果是否包含该知识域的种子网域中的一个或多个(1060)。
8.按照权利要求1所述的计算机执行的方法,其中该计算包括:将过滤结果页面的总数除以种子网域的页面总数(图8)。
9.一种使用具有处理器、存储器和数据存储子系统的计算装置的查询分类的计算机执行的系统,该计算机执行的系统包括:
知识域选择部件,用于选择一个或多个知识域(205);
网域引用部件,用于引用相应的一个或多个知识域内的一个或多个网域(210);
查询引用部件,用于引用一组参考查询(215);
查询分类部件,用于通过处理器将该组参考查询中的各个查询分类到相关知识域中(220);和
应用部件,用于提供从查询分类部件得到的分类器(225)。
10.按照权利要求9所述的计算机执行的系统,其中查询分类部件包括过滤结果部件(516),用于从该组参考查询的过滤网域搜索中获得覆盖率的值。
11.按照权利要求10所述的计算机执行的系统,其中覆盖百分比是由过滤结果部件(718)按照过滤结果页面的总数除以与各个过滤网域搜索的相关网域的页面数量的方式来计算的。
12.按照权利要求11所述的计算机执行的系统,其中为各个知识域内的所有网域计算平均覆盖百分比(720)。
13.按照权利要求9所述的计算机执行的系统, 还包括可信度部件,用来检查该组参考查询中的各个查询与相关知识域的相关度水平(720)。
14.按照权利要求13所述的计算机执行的系统,其中可信度部件包括:
对该组参考查询进行的一般未过滤网络搜索的前面的结果(1040);和
这些前面的结果内存在的一个或多个网域(1060)。
15.按照权利要求13所述的计算机执行的系统,其中可信度部件减少给用户的不期望返回结果(1060)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110408165.9/1.html,转载请声明来源钻瓜专利网。





