[发明专利]用于在对话系统中从用户话语产生自然语言短语的系统和方法有效

申请号：	200980137642.3	申请日：	2009-07-10
公开（公告）号：	CN102165518A	公开（公告）日：	2011-08-24
发明（设计）人：	翁富良;L·斯托亚;J·胡;Z·冯;J·曹	申请（专利权）人：	罗伯特·博世有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G06F17/27;G06F17/28
代理公司：	永新专利商标代理有限公司 72002	代理人：	刘瑜;王英
地址：	德国斯***	国省代码：	德国;DE
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于对话系统用户话语产生自然语言短语方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明的实施例总体上涉及对话系统，更具体地涉及在对话系统中产生用于系统响应的短语。

背景技术

对话系统是计算机系统，其被设计来在输入信道和输出信道上使用连贯的结构和文本、语音、图形或其他交流模式来与人交谈。使用语音的对话系统被称为口语对话系统，并且一般表示最自然类型的人机界面。随着越来越依赖于电子设备，口语对话系统越来越多地被实现在许多不同的机器中。

响应产生是在开发传统对话系统中的重要组成。最终用户经常基于他们从系统听到的响应的质量来判定对话系统的质量。这涉及格莱斯合作原则，格莱斯合作原则描述了人们如何彼此交互，并且假定交谈贡献在适当的时间根据需要来作出，并且用于推进交谈的目的。系统质量的一个方面是避免模糊或所答非所问(non-responsive)的表达，优选的是使用用户熟悉的短语。系统开发者和研究者已经越来越关注响应产生问题，响应产生问题不仅涉及响应产生内容，而且涉及内容呈现。

响应产生系统使用训练模型来产生对用户输入的适当响应。这样的训练模型的质量依赖于训练数据的语料库。已知的训练系统一般使用从一个或多个真人收集的数据。通常，这些系统未使用来自实际用户本身的数据。因此，这样的训练数据不一定适合于实际用户，并且可能不产生用户总是甚至最熟悉的响应。

在本领域中当前已知的一种混合手段使用具有规则适配的基于案例的推理。它使用注解的语料库作为其知识源，并将语法规则用于新语句的构造。在该语料库中，每一个语句与被称为SemGraph的语义表示和被称为ReaTree的实现树(realization tree)相关联。SemGraph描述了与它相关联的语句中的实体之间的语义关系。ReaTree对应于相关联的语句的句法词汇表示，该句法词汇表示用作语句实现的基础。文本产生要经过3个阶段：获取，在该阶段中，在内容规划者给出SemGraph的情况下，从注解的语料库获取具有类似SemGraph的语句；适配，在该阶段中，一个或多个适配操作符被应用到对应的ReaTree，以对当前输入的SemGraph进行必要调整；以及线性化，在该阶段中，适配后的ReaTree被发送到线性化模块，以产生满足所有的语法协议要求的语句。另外，在产生语句后调用学习阶段，在该阶段中，SemGraph、其对应的适配后的ReaTree和所产生的语句被首先存储在临时案例储存库中，然后在被包含到主语料库内以供重新使用之前被手动验证。这种手段不直接地处理从用户侧对语句的使用来进行系统响应。此外，在获取步骤期间，仅主题通过使用替代、删除和插入而被调整来用于计算相似度。不在语音行为方面进行任何操作。因此，在用户的SemGraph和系统响应的SemGraph之间的相似度通常很低。

其他手段可以提供在用户和系统响应之间提高的对齐，但是这样的系统(诸如使用词袋或二元词袋手段来计算在系统响应候选和其对应的用户话语之间的距离的那些系统)通过基于规则的产生系统和手写规则来超额地产生系统响应候选。这样的系统不从用户话语直接地或自动地识别提供更好的对齐和更自然的措辞的承载约束的短语。

其他已知系统使用压缩森林(packed forest)来提供用于产生的统计手段，以结构化地表示许多实例。在这样的系统中，统计语言模型用于在给定语义输入的情况下对替代品分级。然而，这些手段不处理对齐问题。总之，所有目前的手段(包括试图对用户数据直接建模的那些手段)未充分地解决在用户话语和系统响应之间的不一致的问题。

因此，所需要的是一种对话系统响应产生器，其有效地使用实际用户输入，以便产生对于用户最有意义的响应。

附图说明

在附图的图中通过示例而不是限制地方式说明了本发明的实施例，在附图中，相似的附图标记指示类似的元件，并且其中：

图1是根据一个实施例的、包含使用用户输入的响应产生系统的口语对话系统的框图。

图2是在一个实施例下的、使用用户输入的口语对话系统的响应产生器的框图。

图3是图示在一个实施例下的、用于使用实际用户输入来在对话系统中产生响应的整体方法的流程图。

图4是图示在一个实施例下的、在短语模型的构造或训练中的主要功能步骤的流程图。

图5是图示在一个实施例下的、在语句产生处理的主要功能步骤的流程图。

具体实施方式

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司，未经罗伯特·博世有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】