[发明专利]一种教育机器人对话数据集的生成方法、装置及存储介质在审

专利信息
申请号: 202011147186.5 申请日: 2020-10-23
公开(公告)号: CN112256851A 公开(公告)日: 2021-01-22
发明(设计)人: 闫晓宇;于丹;李雪;马壮;王宇;管浩言 申请(专利权)人: 大连东软教育科技集团有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F40/186;G06K9/62
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 李馨
地址: 116000 辽宁省大*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 教育 机器人 对话 数据 生成 方法 装置 存储 介质
【说明书】:

发明提供一种教育机器人对话数据集的生成方法、装置及存储介质。方法包括:获取目标课程的知识点清单,并根据知识点清单构建对话机器人的封闭域;设定对话意图和词槽,所述词槽为对话中的关键信息,其根据所述对话意图的类型选择,所述对话意图类型包括通知类和需求类;构建问句模板,所述问句模板包括首问句模板和再问句模板;根据对话机器人的封闭域生成对话目标;基于所述对话目标和问句模板生成多轮对话语句。本发明可应用于自然语言处理和数据生成领域,尤其是多轮问话数据集的生成,并基于生成的数据集,训练特定封闭域内的任务驱动型多轮对话机器人。

技术领域

本发明涉及自然语言处理和数据生成领域,具体而言,尤其涉及一种教育机器人对话数据集的生成方法、装置及存储介质。

背景技术

目前对于封闭域的任务驱动型多轮对话数据集大多由人工生成,这可以得到最接近人类自然语言的对话,例如DSTC系列数据集,WOZ,MultiWOZ,CrossWOZ等。这些数据集的生成针对于餐馆、景点、酒店等特定的域,其包含的对话内容紧紧耦合在这些域上,很难应用到其它域的对话机器人训练过程中。此外用人工的方法生成数据集所需要的时间周期较长,更重要的是,人工产生对话数据集的价格是十分昂贵的,为多轮对话的研究带来了阻力。

而另一方面,虽然我们可以根据需求编写简单的代码自动生成一些对话语句,但这样的文本结构很难应用到对话机器人的算法当中。目前还没有成熟的方法可以自动生成适合作为多轮对话相关算法输入的数据集。

发明内容

本发明公开了一种教育机器人多轮对话数据集的生成方法、装置及存储介质。以解决现有技术中缺乏自动生成适合作为多轮对话相关算法输入的数据集的技术问题。

本发明采用的技术手段如下:

一种教育机器人对话数据集的生成方法,包括:

获取目标课程的知识点清单,并根据知识点清单构建对话机器人的封闭域;

设定对话意图和词槽,所述词槽为对话中的关键信息,其根据所述对话意图的类型选择,所述对话意图类型包括通知类和需求类;

构建问句模板,所述问句模板包括首问句模板和再问句模板,所述首问句模板包含多轮对话进行的必要信息,所述再问句在多轮对话首轮后的任意一轮问句生成时被调用;

根据对话机器人的封闭域生成对话目标;

基于所述对话目标和问句模板生成多轮对话语句。

进一步地,所述根据知识点清单构建对话机器人的封闭域,还包括通过更新知识点清单切换对话机器人的封闭域。

进一步地,所述通知类表示需要提供给机器人信息的意图;请求类表示希望从机器人处得到信息的意图。

一种教育机器人对话模型训练方法,包括:

重复执行如上述任一项所述的教育机器人对话数据集的生成方法,生成教育机器人对话数据集,所述教育机器人对话数据集包括多轮对话的提问语句;

将所述教育机器人对话数据集作为训练数据集训练教育机器人对话模型;

基于所述教育机器人对话模型,实现人机对话。

一种教育机器人对话数据集的生成装置,包括:

获取单元,用于获取目标课程的知识点清单,并根据知识点清单构建对话机器人的封闭域;

设定单元,用于设定对话意图和词槽,所述词槽为对话中的关键信息,其根据所述对话意图的类型选择,所述对话意图类型包括通知类和需求类;

构建单元,用于构建问句模板,所述问句模板包括首问句模板和再问句模板,所述首问句模板包含多轮对话进行的必要信息,所述再问句在多轮对话首轮后的任意一轮问句生成时被调用;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连东软教育科技集团有限公司,未经大连东软教育科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011147186.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top