[发明专利]一种语料理解方法及设备在审
| 申请号: | 202010691228.5 | 申请日: | 2020-07-17 |
| 公开(公告)号: | CN111985206A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 孙佳;宋鸣;张东海;陈红 | 申请(专利权)人: | 联想(北京)有限公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06F16/33;G06F16/332;G06F16/35 |
| 代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 周伟 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语料 理解 方法 设备 | ||
1.一种语料理解方法,其特征在于,所述方法包括:
获得用于表征用户意图的语料样本;
通过句法分析器对所述语料样本进行主干提取,获得主干样本,所述主干样本用于表征所述语料样本中的主干信息;
根据所述主干样本对分类模型进行训练,获得第一理解模型;
根据所述语料样本对语义理解模型进行训练,获得第二理解模型;
其中,所述第一理解模型用于在指定语料满足第一条件的情况下,对指定语料进行意图理解,以获得主干意图信息;
所述第二理解模型用于在指定语料满足第二条件的情况下,对指定语料进行意图理解,以获得语料意图信息;
所述第一条件和第二条件不同。
2.根据权利要求1所述的方法,其特征在于,所述第一条件为特定长度范围;
相应的,所述方法还包括:
获得指定语料;
在判断为所述指定语料满足特定长度范围的情况下,通过第一理解模型对指定语料进行意图理解,获得第一主干意图信息;
所述第一主干意图信息为所述主干意图信息的其中之一。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在判断为所述指定语料不满足特定长度范围的情况下,通过句法分析器对所述指定语料进行主干提取,获得主干文本;
通过第一理解模型对所述主干文本进行意图理解,获得第二主干意图信息;
所述第二主干意图信息为所述主干意图信息的其中之一。
4.根据权利要求1或2或所述的方法,其特征在于,所述第二条件为非特定长度范围;
相应的,所述方法还包括:
在判断为所述指定语料满足非特定长度范围的情况下,通过第二理解模型对指定语料进行意图理解,获得第一语料意图信息;
所述第一语料意图信息为所述语料意图信息的其中之一。
5.根据权利要求1或3所述的方法,其特征在于,所述第二条件为经过第一理解模型处理;
相应的,所述方法还包括:
在判断为所述指定语料结果第一理解模型处理后,通过第二理解模型对指定语料进行处理,获得第二语料意图信息;
所述第二语料意图信息为所述语料意图信息的其中一种。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述语料意图信息和所述主干意图信息进行整合,获得与所述指定语料对应的第一指定意图信息。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据与所述主干样本对应的主干意图信息样本和与所述语料样本对应的语料意图信息样本对意图理解模型进行训练,获得第三理解模型;
所述第三理解模型用于对所述语料意图信息和所述主干意图信息进行预测,获得与所述指定语料对应的第一指定意图信息。
8.一种语料理解设备,其特征在于,所述设备包括:
获得模块,用于获得用于表征用户意图的语料样本;
提取模块,用于通过句法分析器对所述语料样本进行主干提取,获得主干样本,所述主干样本用于表征所述语料样本中的主干信息;
训练模块,用于根据所述主干样本对分类模型进行训练,获得第一理解模型;
所述训练模块,用于根据所述语料样本对语义理解模型进行训练,获得第二理解模型;
其中,所述第一理解模型用于在指定语料满足第一条件的情况下,对指定语料进行意图理解,以获得主干意图信息;
所述第二理解模型用于在指定语料满足第二条件的情况下,对指定语料进行意图理解,以获得语料意图信息;
所述第一条件和第二条件不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010691228.5/1.html,转载请声明来源钻瓜专利网。





