[发明专利]基于信息增强的对话状态跟踪方法、系统、装置有效
| 申请号: | 201911276031.9 | 申请日: | 2019-12-12 |
| 公开(公告)号: | CN111061850B | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 赵军;何世柱;刘康;刘庆斌 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F18/232;G06F18/2411;G06F18/214 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 信息 增强 对话 状态 跟踪 方法 系统 装置 | ||
本发明属于自然语言处理技术领域,具体涉及一种基于信息增强的对话状态跟踪方法、系统、装置,旨在解决现有对话状态跟踪方法仅利用对话文本的上下文信息生成的未知槽值的准确度较差的问题。本系统方法包括基于用户t时刻的对话文本,通过对话状态跟踪模型得到t时刻的对话状态;t时刻的对话状态包括一或多个槽值对及对应的概率;所述槽值对包括槽、槽值;所述对话状态跟踪模型基于编码器‑解码器架构的神经网络构建。本发明提高了未知槽值生成的准确度。
技术领域
本发明属于自然语言处理技术领域,具体涉及一种基于信息增强的对话状态跟踪方法、系统、装置。
背景技术
随着互联网的快速发展和智能设备的普及,越来越多的对话系统出现在人们的日常生活中。这些对话系统往往辅助人们完成很多的任务。比如,帮助人们订餐、放音乐等任务。在智能对话系统中,如何理解用户意图,从而明确用户请求,成为对话系统中最重要的一部分。对话状态跟踪正是为了解决这个问题而出现的。
对话状态跟踪是任务导向型对话系统中的重要部分,是对话系统中的难点问题之一。该任务是从多轮的、表达方式多种多样的对话中自动识别出结构化的用户状态。这些结构化的状态通常是由一些预定义的槽和他们的槽值组成。比如在订餐任务中,会有‘食品类型’、‘餐厅位置’和‘价位’等槽,以及一些已知值(预定义状态库中的槽值)。
传统的对话状态跟踪方法大多基于一个这样的假设。所有的槽和槽值都是提前预定义好的,这样可以将对话状态跟踪任务简化为分类任务,这样的简化可以方便模型设计,提升了模型在限定值的数据集上的性能。但是,这些模型难以处理没有在预定义状态库槽值对中的未知槽值。为了处理未知槽值,之前还有一些的方法通过从对话中选择词作为槽值,这样就可以通过相似的上下文信息生成未知槽值,但这种方法却仅仅能够利用对话中的上下文信息。由于对话中话语表达方式的多种多样,上下文信息往往不具备显著的规律性,使得仅仅利用上下文信息生成未知的槽值的模型在复杂上下文下往往不可靠,影响了对话系统在实际中的应用。
发明内容
为了解决现有技术中的上述问题,即为了解决现有对话状态跟踪方法仅利用对话文本的上下文信息生成的未知槽值的准确度较差的问题,本发明第一方面,提出了一种基于信息增强的对话状态跟踪的方法,该方法包括:
基于用户t时刻的对话文本,通过对话状态跟踪模型得到t时刻的对话状态;t时刻的对话状态包括一或多个槽值对及对应的概率;所述槽值对包括槽、槽值;
所述对话状态跟踪模型基于编码器-解码器架构的神经网络构建;所述模型其训练方法为:
步骤A100,基于已标注的对话集获取用户t时刻的对话文本,通过预设的语义关联度评估方法获取所述对话文本中每个词与预定义状态库中各槽值对的槽、槽值的语义关联度;
步骤A200,基于所述用户t时刻的对话文本、t-1时刻的对话状态、所述语义关联度,通过对话状态跟踪模型得到t时刻的对话状态;计算所述对话状态跟踪模型的损失值,更新其参数;
步骤A300,令t=t+1,循环执行步骤A100-A200的方法,直至本次对话结束;
步骤A400,基于所有时刻对应的对话状态,通过预设的语义聚类方法得到聚类后的对话状态,将其增入所述预定义状态库;
步骤A500,采用步骤A100-A200的方法,更新所有时刻的对话状态,并计算所述对话状态跟踪模型的损失值,更新其参数,得到训练好的对话状态跟踪模型。
在一些优选的实施方式中,所述预设的语义关联度评估方法包括中心关联度评估方法、周边关联度评估方法;
所述中心关联度评估方法通过求取所述对话文本中每个词与各槽值对中槽的词向量的余弦相似度获取语义关联度;
所述周边关联度评估方法通过求取所述对话文本中每个词与各槽值对中槽值的余弦相似度获取语义关联度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911276031.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于移动终端的智能3D采集模组
- 下一篇:一种高精度3D信息采集的设备及方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





