[发明专利]一种意图识别方法及装置有效
| 申请号: | 202010320457.6 | 申请日: | 2020-04-22 |
| 公开(公告)号: | CN111581361B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 童丽霞;雷植程;杨念民 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06F40/211;G06N3/0442;G06N3/0464 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李娟 |
| 地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 意图 识别 方法 装置 | ||
1.一种意图识别方法,其特征在于,包括:
对待识别语句进行语义分析,从所述待识别语句中分别获得与多个目标分类任务关联的语义类别,所述多个目标分类任务关联的语义类别至少包括实体类别、状态类别和动作类别;
将获得的各个语义类别组合成简化后的待识别语句;
根据简化后的待识别语句,确定所述待识别语句的意图类别;
所述对待识别语句进行语义分析,从所述待识别语句中分别获得与多个目标分类任务关联的语义类别,具体包括:
基于已训练的句子简化模型,以所述待识别语句为输入,依次通过所述句子简化模型的输入层,对所述待识别语句的各分词进行编码,获得所述各分词的词向量表示和位置向量表示;
将所述各分词的词向量表示和位置向量表示进行拼接,并通过所述句子简化模型的表示层和聚合层,根据所述待识别语句中各分词的序列信息,获得所述各分词的隐藏编码向量;
将所述各分词的隐藏编码向量,通过所述句子简化模型的输出层包含的实体分类模型中的平均池化层、全连接层,获得所述待识别语句的实体类别;
将所述各分词的隐藏编码向量,通过所述输出层包含的动作分类模型中的注意力机制模块,获得所述待识别语句的局部交叉信息,并通过所述动作分类模型中的全连接层,获得所述待识别语句的动作类别;
将所述各分词的隐藏编码向量,通过所述输出层包含的状态分类模型中的注意力机制模块,获得所述待识别语句的局部交叉信息,并通过所述状态分类模型中的全连接层,获得所述待识别语句的状态类别。
2.如权利要求1所述的方法,其特征在于,所述句子简化模型的训练方式,包括:
获取训练语句样本集,其中,所述训练语句样本集中包括多个语句样本,每个训练语句样本表示有实体类别、动作类别和状态类别标注的语句样本;
根据所述训练语句样本集,分别获得所述训练语句样本集中语句样本的各分词的词向量表示和位置向量表示,并根据所述各分词的词向量表示和位置向量表示,获得所述各分词的隐藏编码向量,以及根据所述各分词的隐藏编码向量,识别出语句样本属于实体类别、动作类别和状态类别的标记;
并根据识别出的语句样本属于实体类别、动作类别和状态类别的标记和训练语句样本中标记的实体类别、动作类别和状态类别,训练句子简化模型,直至所述句子简化模型的损失函数收敛,获得已训练的句子简化模型,其中,所述损失函数为识别出的实体类别、动作类别和状态类别与语句样本中标注的实体类别、动作类别和状态类别之间的损失函数。
3.如权利要求2所述的方法,其特征在于,获取训练语句样本集,具体包括:
获得各训练语句样本,其中,所述各训练语句样本是根据预设的实体集、动作集和状态集对语句进行标注后获得的,所述实体集、动作集和状态集是与业务知识库关联的;
对所述各训练语句样本进行重采样,获得训练语句样本集。
4.如权利要求1所述的方法,其特征在于,根据简化后的待识别语句,确定所述待识别语句的意图类别,具体包括:
基于已训练的意图分类模型,以所述简化后的待识别语句为输入参数,确定所述待识别语句对应的意图类别。
5.如权利要求4所述的方法,其特征在于,进一步包括:
根据所述待识别语句对应的意图类别,获得与所述意图类别相似度大于相似度阈值的关联选项;
根据所述简化的待识别语句,对获得的关联选项进行筛选,并将筛选出的关联选项进行推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010320457.6/1.html,转载请声明来源钻瓜专利网。





