[发明专利]融合规则信息的可控制性对话管理扩展方法有效
申请号: | 201810009140.3 | 申请日: | 2018-01-04 |
公开(公告)号: | CN108268616B | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 王唯康;张家俊;李志飞;宗成庆 | 申请(专利权)人: | 中国科学院自动化研究所;出门问问信息科技有限公司 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06F16/242;G06Q50/12 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 郭文浩;陈晓鹏 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 规则 信息 控制性 对话 管理 扩展 方法 | ||
本发明属于人机对话技术领域,具体涉及一种融合规则信息的可控制性对话管理扩展方法,旨在解决数据驱动的对话系统通过重新构建交互环境的方式进行扩展时成本高、效率低下的问题,本方法包括:S1,基于交互数据,确定需要扩充的新用户意图,并对原语言理解模块进行扩展;S2,基于新用户意图,构建该新用户意图对应的新对话规则;S3,基于交互数据、原对话管理模块的对话策略、新对话规则,构建新对话管理模块映射空间所需满足的约束;S4,基于S3中得到的新对话管理模块映射空间所需满足的约束,对原对话管理模块进行扩展,生成新对话管理模块。本发明可以对数据驱动的对话系统根据用户反馈进行快速扩展、高效迭代。
技术领域
本发明属于人机对话技术领域,具体涉及一种融合规则信息的可控制性对话管理扩展方法。
背景技术
任务型对话系统是在某一特定领域(餐馆,酒店或机票领域),通过自然语言交互的形式,辅助用户完成任务的人机交互系统。一般而言,任务型对话系统需要具有如下四个基本功能:语言理解、对话状态跟踪、对话策略和对话生成。其中,对话状态跟踪和对话策略模块一起被称为对话管理模块,是整个系统的核心部分。
由于任务型对话系统能够以更加友好的方式帮助消费者达成目标。因此,人们投入了大量的精力去研究如何设计用户体验更好的对话系统。在目前商用的系统中,对话管理模块普遍采用基于规则的方式实现。开发者需手工编撰对话管理策略,定义出在不同对话上下文下,系统应该执行哪一个动作。这种方法虽然简单直观易于控制,但需要大量的人力和专业知识。最近几年,人们发现通过强化学习的方法可以利用用户提供的反馈信号自动地构建鲁棒的对话管理模块。这种方法避免了设计大量的规则。因此,这种基于数据驱动的设计模式受到了工业界的广泛关注。
然而在设计商用系统时,开发者可以定义出所有合理的系统行为用于完成某一特定任务。系统能够处理的用户意图则需要在系统上线后,根据用户的需求不断地进行扩展。所以在商业开发中,为了使系统对之前没有考虑到的用户意图做出合理的反应,开发者需要对整个系统进行迭代式地扩展。
虽然基于强化学习的方法在构建任务型对话系统上具有极大的优势,但由于数据驱动的对话管理模块是一个黑盒子,如果要对原有的对话管理模块进行扩展只能重新设计交互环境进行再训练。而交互环境的构建十分昂贵。因此,如何花费最少的成本,对已有的基于强化学习的对话管理模块进行高效地扩展,同时保留住数据驱动方法的潜在优势是一个非常值得研究的课题。
发明内容
为了解决现有技术中的上述问题,即为了解决对数据驱动的对话系统进行扩展时成本高、效率低下的问题,本发明提出了一种融合规则信息的可控制性对话管理扩展方法,包括以下步骤:
步骤S1,基于交互数据D,确定需要扩充的新用户意图,并对原语言理解模块进行扩展;
步骤S2,基于步骤S1所选择的新用户意图,构建该新用户意图对应的新对话规则;
步骤S3,基于步骤S1的交互数据、原对话管理模块的对话策略、步骤S2中得到的新对话规则,构建新对话管理模块映射空间所需满足的约束L;
步骤S4,基于步骤S3中得到的新对话管理模块映射空间所需满足的约束L,对原对话管理模块进行扩展,生成新对话管理模块。
进一步地,所述“新对话管理模块映射空间所需满足的约束L”,具体为:
L=λ1LD+λ2LD,θ+λ3LD,R
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;出门问问信息科技有限公司,未经中国科学院自动化研究所;出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810009140.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置以及系统
- 下一篇:用户意图确定方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置