[发明专利]生成和使用知识增强型模型有效
申请号: | 201580043229.6 | 申请日: | 2015-08-11 |
公开(公告)号: | CN106663124B | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 单瀛;毛建昌 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/9535;G06N3/04;G06N5/02 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 使用 知识 增强 模型 | ||
1.一种由一个或多个计算设备实施的方法,所述方法包括:
从存储库采样用户行为数据,所述用户行为数据标识由用户提交的用户提交语言项以及由所述用户响应于所述用户提交语言项而做出的用户选择;以及
从一个或多个结构化知识资源采样结构化知识数据,所述结构化知识数据表达由所述一个或多个结构化知识资源表达的特定语言项之间的关系;
处理所述结构化知识数据以获得转换的知识数据,所述转换的知识数据将由所述结构化知识数据表达的所述关系表示为,响应于提交在所述结构化知识数据中标识的其他语言项而对在所述结构化知识数据中标识的个体语言项做出的其他选择;以及
使用所述用户行为数据和所述转换的知识数据作为训练数据,来训练模型,所述模型使用机器学习训练过程而被训练,
所述模型将输入的语言项投射到在语义空间中表达的概念矢量中,
所述用户行为数据的采样、所述结构化知识数据的采样、所述处理所述结构化知识数据、以及所述模型的训练使用与所述一个或多个计算设备相关联的至少一个处理设备而被执行。
2.根据权利要求1所述的方法,其中所述用户行为数据的每个实例至少表示查询、对所述查询的回答、以及指示用户响应于所述查询是否选择了所述回答的点击值。
3.根据权利要求1所述的方法,其中所述结构化知识数据的每个实例至少表示语言项对、表示所述语言项对之间的关联性的程度的距离测量、以及与所述语言项对相关联的至少一个频率测量。
4.根据权利要求1所述的方法,其中所述结构化知识数据包括:
表示相关的语言项对的实例的第一子集;以及
表示不相关的语言项对的实例的第二子集,
其中所述一个或多个结构化知识资源提供指示每个语言项对是相关还是不相关的信息。
5.根据权利要求1所述的方法,所述转换的知识数据具有特定格式,所述特定格式具有表示所述其他选择的个体点击值。
6.根据权利要求5所述的方法,所述特定格式与所述用户行为数据的对应格式相匹配,其中所述处理包括将所述结构化知识数据的每个实例转换为所述用户行为数据的所述对应格式。
7.根据权利要求5所述的方法,其中:
所述用户行为数据的每个实例至少表示查询、对所述查询的回答、以及指示用户响应于所述查询是否选择了所述回答的用户点击值,
所述结构化知识数据的每个实例至少表示语言项对、表示所述语言项对之间的关联性的程度的距离测量、以及与所述语言项对相关联的至少一个频率测量,并且
其中所述处理包括将与所述结构化知识数据相关联的所述距离测量转换为所述个体点击值,并且将所述至少一个频率测量转换为权重值。
8.根据权利要求7所述的方法,进一步包括整合所述用户行为数据与所述结构化知识数据以产生所述训练数据。
9.根据权利要求8所述的方法,其中所述整合涉及根据与所述实例相关联的对应的权重值来复制所述结构化知识数据的每个实例。
10.根据权利要求1所述的方法,其中所述模型对应于深度学习模型,所述深度学习模型使用多层神经网络来将所述输入的语言项投射到在语义空间中表达的概念矢量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580043229.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:在文档中利用数据搜索
- 下一篇:提问句生成装置以及记录介质