[发明专利]语音查询的解析方法、解析模型的训练方法、装置、设备有效
| 申请号: | 202010612016.3 | 申请日: | 2020-06-30 |
| 公开(公告)号: | CN111767372B | 公开(公告)日: | 2023-08-01 |
| 发明(设计)人: | 张雷;周景博;熊辉 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/30;G06F40/295 |
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 曹娜 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 查询 解析 方法 模型 训练 装置 设备 | ||
1.一种语音查询的解析方法,包括:
将语音查询输入预先训练的解析模型;
获取所述解析模型输出的所述语音查询的解析结果,所述语音查询的解析结果包括所述语音查询的意图以及根据所述语音查询确定的目标空间域实体;
其中,所述解析模型包括:第一解析子模型、第二解析子模型及第三解析子模型;
所述第一解析子模型被配置为接收所述语音查询,提取出至少一个参考空间域实体,并预测出所述至少一个参考空间域实体中的每个参考空间域实体的类别,将所述每个参考空间域实体的类别输入所述第二解析子模型,将所述每个参考空间域实体以及所述每个参考空间域实体的类别输入所述第三解析子模型;
所述第二解析子模型被配置为接收所述语音查询和所述每个参考空间域实体的类别,确定并输出所述语音查询的意图;
所述第三解析子模型被配置为接收所述语音查询、所述至少一个参考空间域实体中的每个参考空间域实体和所述每个参考空间域实体的类别,输出所述目标空间域实体;
其中,所述语音查询的意图的确定方式,包括:
获取所述语音查询的词向量;
根据所述词向量确定所述语音查询的意图类别;
根据所述词向量、所述意图类别和所述每个参考空间域实体的类别确定所述语音查询的意图;
其中,所述输出所述目标空间域实体,包括:
获取与所述参考空间域实体相关的至少一个候选空间域实体;
根据预定规则,对所述至少一个候选空间域实体中的每个候选空间域实体进行排序,将排序最高的候选空间域实体作为输出的目标空间域实体。
2.根据权利要求1所述的方法,其中,所述获取与所述参考空间域实体相关的至少一个候选空间域实体,包括:
根据词义、子词、编辑距离、所述参考空间域实体的位置和所述语音查询的词向量中的至少一种,获取与所述参考空间域实体相关的至少一个候选空间域实体。
3.根据权利要求1或2所述的方法,其中,所述根据预定规则,对所述至少一个候选空间域实体中的每个候选空间域实体进行排序,包括:
根据与所述语音查询的词向量的相关度,确定所述至少一个候选空间域实体中的每个候选空间域实体的第一分数;
根据与所述参考空间域实体的相似性,确定所述至少一个候选空间域实体中的每个候选空间域实体的第二分数;
获取所述至少一个候选空间域实体中的每个候选空间域实体的类别,根据与所述参考空间域实体的类别的相似性,确定所述至少一个候选空间域实体中的每个候选空间域实体的第三分数;
根据所述第一分数、所述第二分数和所述第三分数,对所述至少一个候选空间域实体中的每个候选空间域实体进行排序。
4.一种解析模型的训练方法,包括:
将语音查询样本输入待训练的解析模型;
获取所述解析模型输出的所述语音查询样本的解析结果预测值,所述语音查询样本的解析结果预测值包括所述语音查询样本的意图预测值以及根据所述语音查询样本确定的目标空间域实体预测值;
确定所述意图预测值与意图真值之间的第一差值,以及所述目标空间域实体预测值与目标空间域实体真值之间的第二差值;
利用所述第一差值和所述第二差值对所述待训练的解析模型进行训练;
其中,所述待训练的解析模型包括:第一解析子模型、第二解析子模型及第三解析子模型;
所述第一解析子模型被配置为接收所述语音查询样本,提取出至少一个参考空间域实体,并预测出所述至少一个参考空间域实体中的每个参考空间域实体的类别预测值,将所述每个参考空间域实体的类别预测值输入所述第二解析子模型,将所述每个参考空间域实体以及所述每个参考空间域实体的类别预测值输入所述第三解析子模型;
所述第二解析子模型被配置为接收所述语音查询样本和所述每个参考空间域实体的类别预测值,确定并输出所述语音查询样本的意图预测值;
所述第三解析子模型被配置为接收所述语音查询样本、所述至少一个参考空间域实体中的每个参考空间域实体和所述每个参考空间域实体的类别预测值,输出所述目标空间域实体预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010612016.3/1.html,转载请声明来源钻瓜专利网。





