[发明专利]意图识别方法、装置、电子设备和计算机可读存储介质在审
| 申请号: | 202010969999.6 | 申请日: | 2020-09-14 |
| 公开(公告)号: | CN112256845A | 公开(公告)日: | 2021-01-22 |
| 发明(设计)人: | 陈见耸;周乾琳;杨帆 | 申请(专利权)人: | 北京三快在线科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/36;G06F40/30 |
| 代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
| 地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 意图 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种意图识别方法,其特征在于,包括:
获取待识别语句并根据所述待识别语句在意图样例库中进行检索,得到与所述待识别语句相匹配的候选语句样例;
从意图样例库中选取与所述候选语句样例相匹配的语句样例作为扩展语句样例,根据所述候选语句样例和所述扩展语句样例,确定与待识别语句对应的语句样例组;
将所述待识别语句与所述语句样例组拼接得到改写语句,根据意图识别模型和所述改写语句确定所述待识别语句的意图识别结果。
2.根据权利要求1所述的意图识别方法,其特征在于,所述获取待识别语句并根据所述待识别语句在意图样例库中进行检索,得到与所述待识别语句相匹配的候选语句样例包括:
确定所述待识别语句与所述意图样例库中各语句样例的文本相似度;
根据所述文本相似度确定与所述待识别语句相匹配的至少一个候选语句样例。
3.根据权利要求1所述的意图识别方法,其特征在于,所述意图样例库中保存有语句样例和意图标签的对应关系,所述从意图样例库中选取与所述候选语句样例相匹配的语句样例作为扩展语句样例,根据所述候选语句样例和所述扩展语句样例,确定与所述待识别语句对应的语句样例组包括:
根据所述候选语句样例的意图标签对所述候选语句样例进行分组,得到至少一个候选语句样例组;
根据各候选语句样例组中的候选语句样例个数对各候选语句样例组进行样例扩展,将扩展后的候选语句样例组作为所述待识别语句对应的语句样例组。
4.根据权利要求3所述的意图识别方法,其特征在于,所述根据各候选语句样例组中的候选语句样例个数对各候选语句样例组进行样例扩展,将扩展后的候选语句样例组作为所述待识别语句对应的语句样例组包括:
将各候选语句样例组中的候选样例个数与第一预设阈值进行比较;
当所述候选语句样例组中的候选样例个数小于第一预设阈值时,在所述意图样例库中检索与该候选语句样例组的意图标签相匹配且与所述待识别语句的文本相似度低于第二预设阈值的扩展语句样例,根据该候选语句样例组和扩展语句样例得到所述待识别语句对应的语句样例组。
5.根据权利要求4所述的意图识别方法,其特征在于,所述方法还包括:
当所述候选语句样例组中的候选语句样例个数大于所述第一预设阈值时,则将所述候选语句样例组中与所述待识别语句的文本相似度大于第三预设阈值的候选语句样例确定为保留的候选语句样例,根据保留的候选语句样例得到所述待识别语句对应的语句样例组。
6.根据权利要求1所述的意图识别方法,其特征在于,所述将所述待识别语句与所述语句样例组拼接得到改写语句,根据意图识别模型和所述改写语句确定所述待识别语句的意图识别结果包括:
利用第一预设分隔符将各语句样例组中的各语句样例进行组内拼接,得到第一拼接结果;
利用第二预设分隔符将所述待识别语句与各语句样例组进行拼接,得到第二拼接结果;
将所述第一拼接结果和所述第二拼接结果组合后输入所述意图识别模型进行识别,得到所述待识别语句的意图识别结果。
7.根据权利要求1所述的意图识别方法,其特征在于,所述根据意图识别模型和改写语句确定所述待识别语句的意图识别结果包括:
利用所述意图识别模型确定所述待识别语句的意图与各语句样例组的意图标签相同的概率;
根据所述概率确定所述待识别语句的意图识别结果。
8.根据权利要求1至7任一项所述的意图识别方法,其特征在于,所述意图识别模型通过如下方法训练得到:
获取待训练语句并根据所述待训练语句在意图样例库中进行检索,得到与所述待训练语句相匹配的候选语句样例;
从意图样例库中选取与所述候选语句样例相匹配的语句样例作为扩展语句样例,根据所述候选语句样例和所述扩展语句样例,确定与待训练语句对应的语句样例组;
将所述待训练语句与各语句样例组进行拼接后输入所述意图识别模型进行训练,得到各语句样例组对应的训练损失值,根据各语句样例组对应的训练损失值对所述意图识别模型的参数进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010969999.6/1.html,转载请声明来源钻瓜专利网。





