[发明专利]一种语义意图识别方法、装置、设备及存储介质在审
申请号: | 201910509538.8 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110334344A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 王星星 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/33;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本信息 意图识别 语义 意图信息 匹配 关键词信息 存储介质 线性特征 准确率 学习 文本特征信息 计算复杂度 模型学习 权重数据 权重向量 输入意图 特征输入 一维线性 语义理解 语义信息 多维度 输出层 转换层 卷积 两层 申请 分析 保证 | ||
1.一种语义意图识别方法,其特征在于,所述方法包括:
获取文本信息;
将所述文本信息输入意图识别模型进行意图识别处理,得到所述文本信息的意图信息;
获取所述文本信息中与所述意图信息匹配的关键词信息;
基于所述匹配的关键词信息确定与所述意图信息相匹配的语义信息;
其中,所述意图识别模型包括:特征输入转换层、两层的多线性特征学习层、卷积层和输出层,所述多线性特征学习层的学习权重数据为一维线性权重向量。
2.根据权利要求1所述的方法,其特征在于,所述多线性特征学习层包括:
多线性注意力学习单元、第一归一化相加处理单元、门控制单元、前向学习单元和第二归一化相加处理单元;
其中,所述多线性注意力学习单元用于基于特征输入转换层得到的文本特征矩阵与一维线性权重向量进行多维度文本特征学习。
3.根据权利要求1所述的方法,其特征在于,所述基于特征输入转换层得到的文本特征矩阵与一维线性权重向量进行多维度文本特征学习包括:
对所述特征输入转换层输出的词向量与第一一维线性权重向量进行点积归一化处理;
基于第二一维线性权重向量和第三一维线性权重向量对点积归一化处理后的特征向量和所述特征输入转换层输出的词向量进行线性变换处理;
基于预设阈值函数对所述线性变化处理后的特征向量进行阈值映射处理;
基于阈值映射处理后的特征向量、点积归一化处理后的特征向量和所述特征输入转换层输出的词向量确定所述文本信息的多维度文本特征向量。
4.根据权利要求1所述的方法,其特征在于,所述意图识别模型包括采用下述方式确定:
获取标注有意图标识的文本信息;
基于所述标注有意图标识的文本信息对预设深度学习模型进行训练得到所述意图识别模型;
其中,所述意图标识至少包括下述之一:下单意图标识、指示支付意图标识、指定支付工具意图标识、会话结束意图标识、备注意图标识、取消订单意图标识、增减指定对象意图标识。
5.根据权利要求1所述的方法,其特征在于,当所述意图信息包括下单意图时,所述获取所述文本信息中与所述意图信息匹配的关键词信息包括:
对所述文本信息进行分词处理,得到文本信息中的分词词语;
基于预设词性备注库对所述分词词语进行词性分析,得到所述分词词语的词性;
基于所述分词词语的词性确定与所述意图信息匹配的关键词信息;
其中,所述预设词性备注库包括具有词性备注的词语。
6.根据权利要求1所述的方法,其特征在于,当所述意图信息包括下单意图时,所述基于所述匹配的关键词信息确定与所述意图信息相匹配的语义信息包括:
基于所述匹配的关键词信息生成与所述意图信息相匹配的文本短句;
对所述文本短句进行语义分析,得到所述文本短句的语义信息;
将所述文本短句的语义信息作为所述与所述意图信息相匹配的语义信息。
7.根据权利要求6所述的方法,其特征在于,当所述文本短句的语义信息间存在语义歧义时,所述方法还包括:
获取所述存在语义歧义的文本短句中词语的位置权重和频率权重;
基于所述位置权重和频率权重分别对所述存在语义歧义的文本短句进行去歧义处理;
相应的,所述将所述文本短句的语义信息作为所述与所述意图信息相匹配的语义信息包括:
将去歧义处理后的文本短句的语义信息作为所述与所述意图信息相匹配的语义信息。
8.根据权利要求1所述的方法,其特征在于,当所述意图信息包括备注意图时,所述基于所述匹配的关键词信息确定与所述意图信息相匹配的语义信息包括:
确定所述匹配的关键词信息中的对象关键词;
基于预设对象备注图谱确定与所述对象关键词相匹配的对象备注信息;
基于所述对象备注信息确定与所述备注意图相匹配的语义信息;
其中,所述预设对象备注图谱包括对象关键词和对象备注信息的映射关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910509538.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种合同中个人隐私信息抽取的方法和系统
- 下一篇:新词发现方法