[发明专利]对话机器人意图语料生成方法、装置、介质及电子设备在审

专利信息
申请号: 202010201001.8 申请日: 2020-03-20
公开(公告)号: CN111460117A 公开(公告)日: 2020-07-28
发明(设计)人: 陈亮;李治根;杨坤;许开河;周琳;王少军;王嘉雯 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F40/30
代理公司: 深圳市隆天联鼎知识产权代理有限公司 44232 代理人: 孙强
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 对话 机器人 意图 语料 生成 方法 装置 介质 电子设备
【说明书】:

本公开涉及数据处理领域,揭示了一种对话机器人意图语料生成方法、装置、介质及电子设备。该方法包括:获取包括多个意图的意图集合;获取目标意图的目标相似句语料,作为目标相似句语料集合;确定目标相似句语料与相似句语料的相似度;基于相似度在意图集合中选择出候选相似句语料,以构建候选相似句语料集合;基于候选相似句语料集合中各候选相似句语料与目标相似句语料集合中目标相似句语料的相似度,在候选相似句语料集合的候选相似句语料中确定出属于目标意图的目标相似句语料。此方法下,实现了意图语料的自动扩充,提高了意图语料的数量,可以使各意图的语料数量更为均衡,进而提高了意图识别的准确率,还降低了扩展意图语料所需的成本。

技术领域

本公开涉及数据处理技术领域,特别涉及一种对话机器人意图语料生成方法、装置、介质及电子设备。

背景技术

目前对话机器人,特别是任务型对话机器人普遍依赖意图识别算法进行意图识别,对话机器人一般根据识别后的意图执行相应的动作,如话术回复,信息查询等。然而,对话机器人在进行对话时,若要保证对话质量,需要对每个意图下的相似句数量和质量都有很高的要求。不同对话机器人能够执行不同任务的对话,经常存在有些对话机器人积累的低频问题的意图语料较少、各意图语料间数量不均衡等问题,从而降低了意图识别的准确率,此外,如果安排标注人员进行标注,还会浪费大量的人工成本。

发明内容

在数据处理技术领域,为了解决上述技术问题,本公开的目的在于提供一种对话机器人意图语料生成方法、装置、介质及电子设备。

根据本公开的一方面,提供了一种对话机器人意图语料生成方法,所述方法包括:

获取包括多个意图的意图集合,其中,每一意图包括多个相似句语料,每一意图对应一个对话机器人,每一对话机器人具有至少一个意图;

获取目标意图所包括的目标相似句语料,作为目标相似句语料集合;

确定所述目标相似句语料与所述相似句语料的相似度;

基于所述相似度在所述意图集合中选择出候选相似句语料,以构建候选相似句语料集合;

基于所述候选相似句语料集合中各候选相似句语料与所述目标相似句语料集合中所述目标相似句语料的相似度,在所述候选相似句语料集合的候选相似句语料中确定出属于所述目标意图的目标相似句语料。

根据本公开的另一方面,提供了一种对话机器人意图语料生成装置,所述装置包括:

第一获取模块,被配置为获取包括多个意图的意图集合,其中,每一意图包括多个相似句语料,每一意图对应一个对话机器人,每一对话机器人具有至少一个意图;

第二获取模块,被配置为获取目标意图所包括的目标相似句语料,作为目标相似句语料集合;

第一确定模块,被配置为确定所述目标相似句语料与所述相似句语料的相似度;

构建模块,被配置为基于所述相似度在所述意图集合中选择出候选相似句语料,以构建候选相似句语料集合;

第二确定模块,被配置为基于所述候选相似句语料集合中各候选相似句语料与所述目标相似句语料集合中所述目标相似句语料的相似度,在所述候选相似句语料集合的候选相似句语料中确定出属于所述目标意图的目标相似句语料。

根据本公开的另一方面,提供了一种计算机可读程序介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行如前所述的方法。

根据本公开的另一方面,提供了一种电子设备,所述电子设备包括:

处理器;

存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如前所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010201001.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top