[发明专利]多领域对话管理系统及其构建方法有效
| 申请号: | 201910385840.7 | 申请日: | 2019-05-09 |
| 公开(公告)号: | CN110096583B | 公开(公告)日: | 2021-05-14 |
| 发明(设计)人: | 俞凯;陈志;陈露 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 方挺;车江华 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 领域 对话 管理 系统 及其 构建 方法 | ||
1.一种多领域对话管理系统,包括:
全局代理,配置为输入为槽无关对话状态,输出为槽无关对话动作分布;
多个本地代理,配置为输入为槽相关对话状态,输出为槽相关对话动作分布;
所述多个本地代理中的每个本地代理之间配置为相互通信,所述多个本地代理中的每个本地代理与所述全局代理之间配置为相互通信,以进行各代理之间的参数共享;
所述本地代理包括多个本地代理层,所述本地代理层包括:
本地隐藏层,配置为对当前本地代理层的输入信息进行处理;
本地到本地消息层,配置为自所述当前本地代理层向其它本地代理发送消息以进行参数共享;
本地到全局消息层,配置为自所述当前本地代理层向所述全局代理层发送消息以进行参数共享;
本地均值单元,配置为根据接收自其它本地代理的消息求均值;
本地求和输出单元,配置为根据来自所述本地隐藏层的输出、来自所述全局代理的消息和所述本地均值单元的输出求和后输出;
所述本地代理输出的槽相关对话动作分布包括对应于每个对话动作的本地偏好值,所述本地偏好值包括:
fi=hi+(li-max(li))
其中,hi为上层的最终动作分布在对应子策略上的偏好值;li为子策略内部这些动作的偏好值;
当前的置信状态是b,第i个子代理的高级别偏好值是hi(φi(b)),并且第i个子代理的第j个对话动作的低级别偏好值是根据所述本地偏好值的公式,第i个子代理的第j个对话动作的最终偏好值是:
2.根据权利要求1所述的系统,其中,
所述全局代理包括多个全局代理层,所述全局代理层包括:
全局隐藏层,配置为对当前全局代理层的输入信息进行处理;
全局到本地消息层,配置为自所述当前全局代理层向所述多个本地代理发送消息以进行参数共享。
3.根据权利要求2所述的系统,其中,所述全局代理层还包括:
全局均值单元,配置为根据接收自所述多个本地代理的消息求均值;
全局求和输出单元,配置为根据所述全局隐藏层的输出信息和来自所述全局均值单元的输出求和后输出。
4.根据权利要求3所述的系统,其中,
所述全局代理输出的槽无关对话动作分布包括对应于每个对话动作的全局偏好值,所述全局偏好值由以下公式确定:
f0=h0+(l0-max(l0))
其中,h0为上层的最终动作分布在对应子策略上的偏好值;l0为子策略内部这些动作的偏好值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910385840.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电力业务中会话机器人的训练方法
- 下一篇:一种应答方法和装置





