[发明专利]搜索系统和相应方法有效
| 申请号: | 201380068827.X | 申请日: | 2013-12-27 |
| 公开(公告)号: | CN104885081A | 公开(公告)日: | 2015-09-02 |
| 发明(设计)人: | 本杰明·麦德洛克;大卫·保罗·威廉姆斯 | 申请(专利权)人: | 触摸式有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营;栗涛 |
| 地址: | 英国*** | 国省代码: | 英国;GB |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 搜索 系统 相应 方法 | ||
1.一种搜索系统,其包括:
一个或多个处理器;以及
存储有程序指令的存储器,其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:
接收文本输入;
使用分类器模型来识别所述文本输入的内容类型,其中所述分类器模型被训练用于在多个内容类型中识别所述文本输入的特征;
基于所识别的内容类型,从一组统计模型中选择统计模型,所述一组统计模型中的每个统计模型与相应的内容类型相关联;
通过所选择的统计模型,生成针对与所述文本输入相关的内容段的相关性估计,其中,所述统计模型是利用与所述内容段相关联的文本以及所述文本与所述内容段之间的相关性值来训练的,并且与所述内容段相关联的所述文本是从多个不同的数据源中提取的;以及
使用所述相关性估计将所述内容段输出作为内容建议。
2.根据权利要求1所述的系统,其中,所述统计模型是在从与所述内容段相关联的所述文本中提取的一个或多个特征上训练的,其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:
从所述文本输入中提取所述一个或多个特征;以及
以所述文本输入的所述一个或多个特征中的各个特征查询所述统计模型,以生成针对与所述文本输入相关的所述内容段的所述相关性估计。
3.根据权利要求1所述的系统,其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:
使用与各个内容段相关联的统计模型,生成针对与所述文本输入相关的多个内容段中的各个内容段的相关性估计,该统计模型是从多个统计模型中选择的,所述多个统计模型是在与所述多个内容段相关联的文本上训练的。
4.根据权利要求3所述的系统,其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:根据相关性将所述多个内容段排序,并确定一个或多个最相关的内容段。
5.根据权利要求4所述的系统,其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:输出所述一个或多个最相关的内容段中的每个内容段的至少一个代表。
6.根据权利要求4所述的系统,其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:输出所述一个或多个最相关的内容段。
7.根据权利要求1所述的系统,其中,所述内容段是特定的实体。
8.根据权利要求1所述的系统,其中,所述内容段与特定实体相关联。
9.根据权利要求4所述的系统,其中,至少一个内容段与特定实体相关联,并且其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:输出与所述一个或多个最相关的内容段相关联的一个或多个实体的至少一个代表。
10.根据权利要求1所述的系统,其中,所述系统进一步包括在与一个或多个内容段有关的非文本数据上训练的统计模型。
11.根据权利要求1所述的系统,其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:
接收非文本证据;以及
使用在非文本数据上训练的统计模型,生成针对与所述非文本证据相关的内容段的相关性估计。
12.根据权利要求3所述的系统,其中,所述一个或多个处理器对所述程序指令的执行使得所述一个或多个处理器:
按内容类型对在文本上训练的所述多个统计模型中的每一个统计模型进行分类;
将所述文本输入分类为一种内容类型;以及
确定被分类到与所述文本输入的所述内容类型相同的内容类型的、所述多个统计模型的子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于触摸式有限公司,未经触摸式有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380068827.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息存储和检索的基于图形的系统和方法
- 下一篇:用于生成数字版本的系统和方法





