[发明专利]一种教育机器人对话数据集的生成方法、装置及存储介质在审
申请号: | 202011147186.5 | 申请日: | 2020-10-23 |
公开(公告)号: | CN112256851A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 闫晓宇;于丹;李雪;马壮;王宇;管浩言 | 申请(专利权)人: | 大连东软教育科技集团有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/186;G06K9/62 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李馨 |
地址: | 116000 辽宁省大*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 教育 机器人 对话 数据 生成 方法 装置 存储 介质 | ||
本发明提供一种教育机器人对话数据集的生成方法、装置及存储介质。方法包括:获取目标课程的知识点清单,并根据知识点清单构建对话机器人的封闭域;设定对话意图和词槽,所述词槽为对话中的关键信息,其根据所述对话意图的类型选择,所述对话意图类型包括通知类和需求类;构建问句模板,所述问句模板包括首问句模板和再问句模板;根据对话机器人的封闭域生成对话目标;基于所述对话目标和问句模板生成多轮对话语句。本发明可应用于自然语言处理和数据生成领域,尤其是多轮问话数据集的生成,并基于生成的数据集,训练特定封闭域内的任务驱动型多轮对话机器人。
技术领域
本发明涉及自然语言处理和数据生成领域,具体而言,尤其涉及一种教育机器人对话数据集的生成方法、装置及存储介质。
背景技术
目前对于封闭域的任务驱动型多轮对话数据集大多由人工生成,这可以得到最接近人类自然语言的对话,例如DSTC系列数据集,WOZ,MultiWOZ,CrossWOZ等。这些数据集的生成针对于餐馆、景点、酒店等特定的域,其包含的对话内容紧紧耦合在这些域上,很难应用到其它域的对话机器人训练过程中。此外用人工的方法生成数据集所需要的时间周期较长,更重要的是,人工产生对话数据集的价格是十分昂贵的,为多轮对话的研究带来了阻力。
而另一方面,虽然我们可以根据需求编写简单的代码自动生成一些对话语句,但这样的文本结构很难应用到对话机器人的算法当中。目前还没有成熟的方法可以自动生成适合作为多轮对话相关算法输入的数据集。
发明内容
本发明公开了一种教育机器人多轮对话数据集的生成方法、装置及存储介质。以解决现有技术中缺乏自动生成适合作为多轮对话相关算法输入的数据集的技术问题。
本发明采用的技术手段如下:
一种教育机器人对话数据集的生成方法,包括:
获取目标课程的知识点清单,并根据知识点清单构建对话机器人的封闭域;
设定对话意图和词槽,所述词槽为对话中的关键信息,其根据所述对话意图的类型选择,所述对话意图类型包括通知类和需求类;
构建问句模板,所述问句模板包括首问句模板和再问句模板,所述首问句模板包含多轮对话进行的必要信息,所述再问句在多轮对话首轮后的任意一轮问句生成时被调用;
根据对话机器人的封闭域生成对话目标;
基于所述对话目标和问句模板生成多轮对话语句。
进一步地,所述根据知识点清单构建对话机器人的封闭域,还包括通过更新知识点清单切换对话机器人的封闭域。
进一步地,所述通知类表示需要提供给机器人信息的意图;请求类表示希望从机器人处得到信息的意图。
一种教育机器人对话模型训练方法,包括:
重复执行如上述任一项所述的教育机器人对话数据集的生成方法,生成教育机器人对话数据集,所述教育机器人对话数据集包括多轮对话的提问语句;
将所述教育机器人对话数据集作为训练数据集训练教育机器人对话模型;
基于所述教育机器人对话模型,实现人机对话。
一种教育机器人对话数据集的生成装置,包括:
获取单元,用于获取目标课程的知识点清单,并根据知识点清单构建对话机器人的封闭域;
设定单元,用于设定对话意图和词槽,所述词槽为对话中的关键信息,其根据所述对话意图的类型选择,所述对话意图类型包括通知类和需求类;
构建单元,用于构建问句模板,所述问句模板包括首问句模板和再问句模板,所述首问句模板包含多轮对话进行的必要信息,所述再问句在多轮对话首轮后的任意一轮问句生成时被调用;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连东软教育科技集团有限公司,未经大连东软教育科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011147186.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种雷电预警模型的优化方法
- 下一篇:色阻结构、显示面板及显示装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置