[发明专利]可搜索索引在审
申请号: | 201510221966.2 | 申请日: | 2015-05-04 |
公开(公告)号: | CN105045799A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | J·哈姆森;T·D·钱德拉;M·方图拉 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 索引 | ||
1.一种由计算机化的机器学习系统实现的方法,所述方法包括:
从由所述计算机化的机器学习系统生成的机器学习的模型接收多个规则,每个规则包括成果、一个或多个特征以及由所述机器学习的模型针对所述一个或多个特征和所述成果预测的成果概率;以及
针对所述多个规则中的每个规则,生成针对基于令牌的索引的条目,所述条目包括:
基于所述规则的所述一个或多个特征的一个或多个令牌;
所述规则的所述成果;以及
所述规则的所述成果概率。
2.根据权利要求1所述的方法,其中所述规则基于文档的未索引的语料库。
3.根据权利要求1所述的方法,其中所述条目与文档相关联。
4.根据权利要求1所述的方法,其中多个所述一个或多个令牌基于查询。
5.根据权利要求1所述的方法,其中所述机器学习的模型使用由一个或多个用户对成果的先前选择被训练。
6.根据权利要求1所述的方法,其中所述基于令牌的索引是从由反向索引和倒排列表组成的组中选择的一个。
7.一种由计算机化的机器学习系统实现的方法,所述方法包括:
接收查询;
基于所述查询标识至少一个令牌;
将至少一个标识的所述令牌匹配到机器学习的基于令牌的索引中的至少一个索引的令牌;
基于至少一个匹配的所述令牌标识至少一个成果;以及
基于至少一个匹配的所述令牌和所述至少一个成果提供针对所述查询的结果。
8.根据权利要求7所述的方法,其中所述提供针对所述查询的所述结果进一步基于成果概率。
9.根据权利要求7所述的方法,其中所述查询基于关键字。
10.根据权利要求7所述的方法,其中所述查询基于文档的点入。
11.根据权利要求7所述的方法,其中所述查询基于事件。
12.根据权利要求7所述的方法,其中所述提供针对所述查询的结果基于多个成果,每个成果与成果概率相关联,并且进一步包括基于所述多个成果的相应成果概率对所述多个成果进行排名。
13.一种由计算机化的系统实现的方法,所述方法包括:
从由所述计算机化的机器学习系统生成的机器学习的模型接收多个规则,每个规则包括成果、一个或多个特征以及由所述机器学习的模型针对所述一个或多个特征和所述成果预测的成果概率;以及
针对所述多个规则中的每个规则,生成针对基于令牌的索引的条目,所述条目包括:
基于所述规则的所述一个或多个特征的一个或多个令牌;
所述规则的所述成果;以及
所述规则的所述成果概率;
接收查询;
基于所述查询标识至少一个令牌;
将至少一个标识的所述令牌匹配到机器学习的基于令牌的索引中的至少一个索引的令牌;
基于至少一个匹配的所述令牌标识至少一个成果;以及
基于至少一个匹配的所述令牌和所述至少一个成果提供针对所述查询的结果。
14.一种系统,包括:
处理器,所述处理器被配置为:
从由所述计算机化的机器学习系统生成的机器学习的模型接收多个规则,每个规则包括成果、一个或多个特征以及由所述机器学习的模型针对所述一个或多个特征和所述成果预测的成果概率;以及
针对所述多个规则中的每个规则,生成针对基于令牌的索引的条目,所述条目包括:
基于所述规则的所述一个或多个特征的一个或多个令牌;
所述规则的所述成果;以及
所述规则的所述成果概率。
15.根据权利要求14所述的系统,其中所述规则基于文档的未索引的语料库。
16.根据权利要求14所述的系统,其中所述条目与文档相关联。
17.根据权利要求14所述的系统,其中多个所述一个或多个令牌基于查询。
18.根据权利要求14所述的系统,其中所述机器学习的模型使用由一个或多个用户对成果的先前选择被训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510221966.2/1.html,转载请声明来源钻瓜专利网。