[发明专利]一种人机对话装置及其实现人机对话的方法有效
申请号: | 201611106354.X | 申请日: | 2016-12-05 |
公开(公告)号: | CN108153780B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 鲍光胜;严念念;鄢志杰;曾华军;初敏 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/216 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 韩辉峰;李丹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人机对话 装置 及其 实现 方法 | ||
1.一种人机对话装置,其特征在于,包括:获取单元、问答单元,以及存储问题的问题数据库;其中,
获取单元,用于在为用户提供服务的对话过程中,获取用户的询问;
问答单元,包括:意图预测模块、意图决策模块;
意图预测模块,用于基于所述用户的询问预测所述问题数据库中与所述询问对应的每个问题回答肯定的概率,形成表示用户意图的表征信息;
意图决策模块,包括问题决策子模块,以及意图决策子模块,其中,
问题决策子模块,用于在多轮问答的每轮问答中,预测得到所述表征信息中每个问题的信息增益,将信息增益最大的问题作为向用户提出的问题,并向用户提出问题;
意图决策子模块,用于以用户对所述向用户提出的问题的答复更新所述表征信息中预测得到的用户回答肯定的概率;直到根据更新后的表征信息确定出用户意图;
所述信息增益表示为:
InfoGain(Qi)=Entropy(pt)–pi×Entropy(pt|pi=1)–(1-pi)×Entropy(pt|pi=0)),其中pt=F(p1,p2,…,pn),Qi(i=1,2,…n)为问题,pi=1表示肯定回答,pi=0表示否定解答。
2.根据权利要求1所述的人机对话装置,其特征在于,还包括:
学习单元,用于以对话语料样本为基础确定对话的问题,并存储在所述问题数据库中。
3.根据权利要求2所述的人机对话装置,其特征在于,所述学习单元具体用于:
从所述对话语料样本中提取客服向用户提出的问题,通过文本聚类,对向用户提出的问题进行分类并存储在所述问题数据库中。
4.根据权利要求1所述的人机对话装置,其特征在于,所述意图预测模块具体用于:
基于所述用户的询问,从对话语料中学习到各个问题和用于表示达成用户意图的一个解答或行为的系统目标之间的关联;基于关联中的问答分布情况预测对所述问题数据库中与所述询问对应的每个问题回答肯定的概率,形成所述表示用户意图的表征信息。
5.根据权利要求1所述的人机对话装置,其特征在于,所述意图决策子模块中存储有预先设置的表征信息与用户意图的映射关系;
意图决策子模块具体用于:根据所述映射关系,找出对应当前形成的所述表征信息的用户意图。
6.一种实现人机对话的方法,其特征在于,包括:
在为用户提供服务的对话过程中,获取用户的询问;
基于所述用户的询问预测问题数据库中与所述询问对应的每个问题回答肯定的概率,形成表示用户意图的表征信息;
在多轮问答的每轮问答中,预测得到所述表征信息中每个问题的信息增益,将信息增益最大的问题作为所述多轮问答中下一轮向用户提出的问题,并向用户提出问题;
以用户对所述向用户提出的问题的答复更新所述表征信息中预测得到的用户回答肯定的概率;直到根据更新后的表征信息确定出用户意图;
所述信息增益表示为:
InfoGain(Qi)=Entropy(pt)–pi×Entropy(pt|pi=1)–(1-pi)×Entropy(pt|pi=0)),其中pt=F(p1,p2,…,pn),Qi(i=1,2,…n)为问题,pi=1表示肯定回答,pi=0表示否定解答。
7.根据权利要求6所述的方法,其特征在于,该方法还包括:以对话语料样本为基础确定对话的问题,并存储在所述问题数据库中。
8.根据权利要求7所述的方法,其特征在于,所述确定对话的问题包括:
从所述对话语料样本中提取客服向用户提出的问题,通过文本聚类,对向用户提出的问题进行分类并存储在所述问题数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611106354.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:页面数据投放信息处理方法及装置
- 下一篇:提取业务领域的关键词的方法和装置