[发明专利]跨领域对话策略的迁移方法及装置、设备、可读存储介质有效

申请号：	201811641823.7	申请日：	2018-12-29
公开（公告）号：	CN109739965B	公开（公告）日：	2022-07-15
发明（设计）人：	莫凯翔	申请（专利权）人：	深圳前海微众银行股份有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F40/30;G06F40/289
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	胡海国
地址：	518052 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	领域对话策略迁移方法装置设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种跨领域对话策略的迁移方法，所述方法包括以下步骤：对已输入的用户输入对话进行处理，以映射出对应的目标领域对话状态；将所述目标领域对话状态映射为源领域对话状态；基于源领域的预设对话策略，对所述源领域对话状态进行处理，得到对应的源领域对话回复；将所述源领域对话回复映射为目标领域对话回复。本发明还提供了一种跨领域对话策略的迁移装置、设备、可读存储介质。本发明解决了现有常规构建的对话系统存在难以维护、人工标注数据的成本高、数据重复标注、标注数据难以跨领域应用的技术问题。

技术领域

本发明涉及计算机技术领域，尤其涉及一种跨领域对话策略的迁移方法及装置、设备、可读存储介质。

背景技术

对话系统是人机交互领域的重要组成部分，目前常规构建的对话系统主要包括：利用规则搭建的对话系统、基于监督学习的对话系统、基于强化学习的对话系统。

利用规则搭建的对话系统出现时间最早，这种系统对人来说比较容易理解，容易控制。其缺点是开发人员需要枚举所有的情况，并且针对每种情况制定规则以进行预先判断。当实际场景复杂且制定规则的数量积累较多时，容易出现规则互相冲突，导致系统难以维护。这种系统难以支撑大规模的对话系统。

基于监督学习的对话系统和基于强化学习的对话系统是基于对模型和数据进行训练得到的，不需要开发人员对所有情况都事先制定规则，只需要收集标注数据，并使用标注数据对模型进行训练即可。但是，这两种对话系统最大的缺点是需要收集大规模的标注数据。然而由于现实应用场景众多，对每个对话场景都收集足够的标注数据显然是不现实的；其主要原因包括：

1.人工标注数据的成本高。

2.不同场景中的可能存在大量的重复标注，造成资源浪费。例如：买咖啡、订机票、订酒店等场景中都会出现相同的需求功能类别(在本发明中称为“意图”)：“告知”、“请求”，以及出现相同的任务信息(在本发明中称为“槽位”)：“地点”、“时间”等。

3.直接把一个领域的数据用于训练另外一个领域的模型难以实现。首先，相同或者相近的意图和槽位可能被不同公司用不同的名称进行标记；其次，不同领域确实存在实质性不同的意图和槽位。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种跨领域对话策略的迁移方法及装置、设备、可读存储介质，旨在解决现有常规构建的对话系统存在难以维护、人工标注数据的成本高、数据重复标注、标注数据难以跨领域应用的技术问题。

为实现上述目的，本发明提供一种跨领域对话策略的迁移方法，所述方法包括以下步骤：

对已输入的用户输入对话进行处理，以映射出对应的目标领域对话状态；

将所述目标领域对话状态映射为源领域对话状态；

基于源领域的预设对话策略，对所述源领域对话状态进行处理，得到对应的源领域对话回复；

将所述源领域对话回复映射为目标领域对话回复。

优选地，所述对已输入的用户输入对话进行处理，以映射出对应的目标领域对话状态的步骤，具体包括：