[发明专利]任务型对话及模型训练方法、装置、设备和存储介质在审
| 申请号: | 202011505708.4 | 申请日: | 2020-12-18 |
| 公开(公告)号: | CN112507103A | 公开(公告)日: | 2021-03-16 |
| 发明(设计)人: | 鲍思琪;何煌;陆华;王凡;牛正雨;吴华;何径舟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06K9/62;G06N20/20 |
| 代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 谷春静 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 任务 对话 模型 训练 方法 装置 设备 存储 介质 | ||
本公开公开了一种任务型对话及模型训练方法、装置、设备和存储介质,涉及计算机技术领域,尤其涉及自然语言处理领域和深度学习领域等人工智能领域。任务型对话方法包括:接收信息;采用知识选择模型,选择与所述信息匹配的知识,所述知识选择模型采用结构化知识和非结构化知识预训练得到,所述结构化知识的槽位包括自然语言描述信息;根据所述信息和所述知识生成回复。本公开可以提高知识选择性能。
技术领域
本公开涉及计算机技术领域,具体涉及自然语言处理领域和深度学习技术领域等人工智能领域,尤其涉及任务型对话及模型训练方法、装置、设备和存储介质。
背景技术
人工智能(Artificial Intelligence,AI)是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
任务型对话系统是一种以完成任务或动作为目的的人机交互系统。现有的任务型对话系统,是使用已有的数据库来回答用户的相关问题,这些数据库信息通常是以结构化知识的形式进行存储的。
发明内容
本公开提供了一种任务型对话及模型训练方法、装置、设备和存储介质。
根据本公开的一方面,提供了一种任务型对话方法,包括:接收信息;采用知识选择模型,选择与所述信息匹配的知识,所述知识选择模型采用结构化知识和非结构化知识预训练得到,所述结构化知识的槽位包括自然语言描述信息;根据所述信息和所述知识生成回复。
根据本公开的另一方面,提供了一种知识选择模型的训练方法,包括:获取训练语料,所述训练语料包括训练信息、训练非结构化知识和训练结构化知识,所述训练结构化知识的槽位包括自然语言描述信息;对所述训练语料进行标注;采用标注后的训练语料进行训练,生成知识选择模型。
根据本公开的另一方面,提供了一种回复生成模型的训练方法,包括:获取训练语料,所述训练语料包括训练信息、训练知识和训练回复;采用输入层将所述训练语料转换为输入向量,所述输入层包括类型向量层,所述类型向量层的输入包括互不相同的信息类型标识、知识类型标识和回复类型标识;采用深度学习网络对所述输入向量和所述训练回复对应的输出向量进行训练,生成回复生成模型。
根据本公开的另一方面,提供了一种任务型对话装置,包括:接收模块,用于接收信息;知识选择模块,用于采用知识选择模型,选择与所述信息匹配的知识,所述知识选择模型采用结构化知识和非结构化知识预训练得到,所述结构化知识的槽位包括自然语言描述信息;回复生成模块,用于根据所述信息和所述知识生成回复。
根据本公开的另一方面,提供了一种知识选择模型的训练装置,包括:获取模块,用于获取训练语料,所述训练语料包括训练信息、训练非结构化知识和训练结构化知识,所述训练结构化知识的槽位包括自然语言描述信息;标注模块,用于对所述训练语料进行标注;训练模块,用于采用标注后的训练语料进行训练,生成知识选择模型。
根据本公开的另一方面,提供了一种回复生成模型的训练装置,包括:获取模块,用于获取训练语料,所述训练语料包括训练信息、训练知识和训练回复;转换模块,用于采用输入层将所述训练语料转换为输入向量,所述输入层包括类型向量层,所述类型向量层的输入包括互不相同的信息类型标识、知识类型标识和回复类型标识;训练模块,用于采用深度学习网络对所述输入向量和所述训练回复对应的输出向量进行训练,生成回复生成模型。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011505708.4/2.html,转载请声明来源钻瓜专利网。





