[发明专利]上下文敏感短语标识在审
申请号: | 201680014064.4 | 申请日: | 2016-03-11 |
公开(公告)号: | CN107548494A | 公开(公告)日: | 2018-01-05 |
发明(设计)人: | T·卡普勒;B·凯夫尔;P·J·斯腾加德 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06F17/24 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开的实施例涉及用于处理来自至少一个文本信息源的文本信息的计算设备。计算设备包括处理器,作为计算设备的功能部件并且被配置为执行用于处理文本信息的指令;侦听器部件,被配置为从至少一个源接收文本信息;上下文分析器,被耦合到侦听器部件并且被配置为生成相对于文本信息的上下文信息;内容分析器,被耦合到侦听器部件并且被配置为从文本信息中标识n元语法集合并且通过使用概率数据结构去除至少一些n元语法来提供过滤后的内容,概率数据结构确定给定元素是否为集合的成员;以及索引部件,被配置为对过滤后的内容进行索引。本公开的实施例还涉及用于提供与上下文敏感短语的交互的计算设备。 | ||
搜索关键词: | 上下文 敏感 短语 标识 | ||
【主权项】:
一种用于处理来自至少一个文本信息源的文本信息的计算设备,所述计算设备包括:处理器,作为所述计算设备的功能部件并且被配置为执行用于处理所述文本信息的指令;侦听器部件,被配置为从所述至少一个源接收所述文本信息;上下文分析器,被耦合到所述侦听器部件并且被配置为生成相对于所述文本信息的上下文信息;内容分析器,被耦合到所述侦听器部件并且被配置为从所述文本信息中标识n元语法集合并且通过使用概率数据结构去除至少一些n元语法来提供过滤后的内容,所述概率数据结构确定给定元素是否为集合的成员;以及索引部件,被配置为对所述过滤后的内容进行索引。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201680014064.4/,转载请声明来源钻瓜专利网。