[发明专利]融合规则信息的可控制性对话管理扩展方法有效
| 申请号: | 201810009140.3 | 申请日: | 2018-01-04 |
| 公开(公告)号: | CN108268616B | 公开(公告)日: | 2020-09-01 |
| 发明(设计)人: | 王唯康;张家俊;李志飞;宗成庆 | 申请(专利权)人: | 中国科学院自动化研究所;出门问问信息科技有限公司 |
| 主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06F16/242;G06Q50/12 |
| 代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 郭文浩;陈晓鹏 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 融合 规则 信息 控制性 对话 管理 扩展 方法 | ||
1.一种融合规则信息的可控制性对话管理扩展方法,其特征在于,包括以下步骤:
步骤S1,基于交互数据D,确定需要扩充的新用户意图,并对原语言理解模块进行扩展;
步骤S2,基于步骤S1所选择的新用户意图,构建该新用户意图对应的新对话规则;
步骤S3,基于步骤S1的交互数据、原对话管理模块的对话策略、步骤S2中得到的新对话规则,构建新对话管理模块映射空间所需满足的约束L;
步骤S4,基于步骤S3中得到的新对话管理模块映射空间所需满足的约束L,对原对话管理模块进行扩展,生成新对话管理模块;
所述“新对话管理模块映射空间所需满足的约束L”,具体为:
L=λ1LD+λ2LD,θ+λ3LD,R
其中,LD为新对话管理模块的行为与原对话管理模块的行为一致性约束;LD,θ为新对话管理模块的行为策略与原对话管理模块的行为策略一致性约束;LD,R为新对话管理模块的行为策略与定义的新对话规则符合性约束;λ1、λ2、λ3为预设的权值参数;
其中,θnew为新对话管理模块的模型参数;θ为原对话管理模块的模型参数;d为交互数据D中的对话样本;t为对话样本d的轮数;|As|为系统行为的个数对话规则中行为的个数;ht为第t轮对话的对话上下文;ak为新对话管理模块在当前对话上下文ht下的行为;at为原始系统在当前对话历史ht下的行为,π(·)为原对话管理模块;L是用于处理新用户意图而定义的对话规则的个数;hl为第l条规则中声明的对话上下文条件;al为规则上下文条件hl满足时系统应该执行动作。
2.根据权利要求1所述的融合规则信息的可控制性对话管理扩展方法,其特征在于,所述“对原语言理解模块进行扩展”,其方法为:
在原语言理解模块的基础上,基于需要扩充的新用户意图,添加新用户意图的标注数据,并重新训练语言理解模块。
3.根据权利要求1所述的融合规则信息的可控制性对话管理扩展方法,其特征在于,所述“对原对话管理模块进行扩展”,其方法为:
在原对话管理模型的对话状态表示中添加额外的字段表示新用户意图;
设置所述新用户意图对应的对话规则;
设置新对话管理模块映射空间所需满足的约束。
4.根据权利要求1-3任一项所述的融合规则信息的可控制性对话管理扩展方法,其特征在于,所述新对话管理模块和原对话管理模块,均为基于数据驱动的对话管理模块。
5.根据权利要求1-3任一项所述的融合规则信息的可控制性对话管理扩展方法,其特征在于,通过构造两种用户仿真环境Sim1和Sim2,对所述新对话管理模块进行训练和测试;其中Sim1用于训练原始对话管理模块,Sim2用于模拟具有未知因素的线上环境。
6.根据权利要求1-3任一项所述的融合规则信息的可控制性对话管理扩展方法,其特征在于,还包括用户满意度计算方法:
其中,Satis.为用户满意度,d为交互数据D中的对话样本,t为对话样本d的轮数,L是定义的对话规则个数,ht为第t轮对话的对话上下文,hl为第l条规则中声明的对话上下文条件,at为原始系统在当前对话历史ht下的行为,al为规则上下文hl满足时系统应该执行动作,1{}代表指示函数,如果指示函数等号两边的变量相等则指示函数指为1否则为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;出门问问信息科技有限公司,未经中国科学院自动化研究所;出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810009140.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置以及系统
- 下一篇:用户意图确定方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





