[发明专利]生成和使用知识增强型模型有效
申请号: | 201580043229.6 | 申请日: | 2015-08-11 |
公开(公告)号: | CN106663124B | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 单瀛;毛建昌 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/9535;G06N3/04;G06N5/02 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 使用 知识 增强 模型 | ||
本文描述用于基于用户行为数据和知识数据生成模型的功能。在一种情况下,用户行为数据标识由用户提交的查询,连同由用户响应于查询而做出的选择。知识数据表示如一个或多个结构化知识资源表达的语言项之间的关系。功能利用知识数据提供关于可能不能通过用户行为数据充分捕获的语义关系的信息,以由此产生更稳健和精确的模型(与仅基于用户行为数据产生的模型相比)。本文还描述用于在被训练后应用模型的功能。在一种情况下,模型可以对应于深度学习模型。
背景技术
典型的商业搜索引擎可以采用在机器学习过程中产生的模型。机器学习过程可以基于点通(click-through)数据来训练模型。点通数据进而标识由用户提交的查询以及由用户响应于查询而做出的选择(例如“点击”)。
发明内容
本文描述一种用于基于用户行为数据和知识数据、使用机器学习过程来生成模型的计算机实现的功能。用户行为数据标识由用户提交的语言项,以及响应于语言项而由用户做出的选择。例如,用户行为数据可以对应于点通数据,包括由用户提交的查询连同响应于查询而由用户做出的点击选择。知识数据表示语言项之间的关系,如通过一个或多个结构化知识资源表达。功能利用知识数据以提供关于可能不能通过用户行为数据充分捕获的语义关系的信息,因此与仅仅基于用户行为数据训练的模型相比产生更精确和稳健的模型。
本公开还涉及在以上归纳的查询中产生的模型以及针对在搜索引擎内应用模型的功能。
根据一个非限制性实施方式,模型对应于深度学习模型。深度学习模型使用多级分析以将每个语言输入项变换为概念矢量。概念矢量表达语义空间内的语言输入项的高级含义。
以上方法可以在各种类型的系统、元件、方法、计算机可读存储介质、数据结构等中表现。
提供了本发明的发明内容以便引入简化的形式的概念的选择;这些概念进一步在下面的具体实施方式中描述。本发明内容并不旨在识别所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
附图说明
图1示出用于产生并应用模型的说明性环境,模型是诸如但不限于深度学习模型。模型基于用户行为数据和知识数据的组合而产生。
图2示出表示仅通过点通数据训练的模型的性能的直方图。
图3示出表示通过点通数据和知识数据两者训练的模型的性能的直方图。
图4示出表示图1环境的一个实施方式的计算机系统。
图5示出作为图1的环境的元件的训练数据编译模块(TDCM)的一个实施方式。TDCM生成用于训练模型中的主训练数据。主训练数据进而基于用户行为数据和知识数据而产生。
图6示出一种类型的结构化知识资源的结构的示例。
图7示出图1的环境的元件的排名系统的一个实施方式。
图8示出作为图7的排名系统的元件的相关性评估框架(RAF)的一个实施方式。RAF利用深度学习模型的使用。
图9示出作为图8的RAF的元件的语义变换模块的一个实施方式。
图10示出图8的整体RAF的一个实施方式。
图11示出用于产生深度学习模型的训练系统(也在图1中示出)的一个实施方式。
图12是概述一种基于用户行为数据和点通数据来产生模型的方式的流程图。
图13是解释一种基于用户行为数据和知识数据来产生主训练数据的方式的流程图。
图14是示出根据图12和图13的流程图在搜索引擎中产生的一种应用模型的方式的流程图。
图15示出可以用于实施前面附图中示出的特征的任意方面的说明性计算功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580043229.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:在文档中利用数据搜索
- 下一篇:提问句生成装置以及记录介质