[发明专利]全双工语音对话中的多阶段响应有效

申请号：	201880085943.5	申请日：	2018-10-25
公开（公告）号：	CN111566727B	公开（公告）日：	2023-09-01
发明（设计）人：	周力	申请（专利权）人：	微软技术许可有限责任公司
主分类号：	G10L15/18	分类号：	G10L15/18
代理公司：	永新专利商标代理有限公司 72002	代理人：	张立达
地址：	美国华***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	双工语音对话中的阶段响应
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于通过电子对话代理在语音对话中进行响应的方法，包括：

在音频上行流中接收语音输入；

响应于所述语音输入，生成主要响应和至少一个补充响应；

基于所述主要响应来生成主要语音输出；

基于所述至少一个补充响应来生成至少一个补充语音输出；以及

在音频下行流中提供所述主要语音输出和所述至少一个补充语音输出，其中，所述至少一个补充语音输出是在所述音频下行流中与所述主要语音输出相邻的时间段期间提供的。

2.根据权利要求1所述的方法，其中，在所述时间段期间没有接收到有效语音输入。

3.根据权利要求1所述的方法，其中，所述时间段在完成对所述语音输入的接收的时间点和提供所述主要语音输出的时间点之间。

4.根据权利要求3所述的方法，其中，所述生成所述至少一个补充响应包括：

基于至少一个填充词来生成所述至少一个补充响应，其中，所述至少一个填充词的输出的持续时间以预定概率在所述时间段的持续时间内。

5.根据权利要求4所述的方法，其中，所述生成所述主要响应包括：

在接收所述语音输入期间生成对所述语音输入的预测；以及

基于所述预测来生成所述主要响应。

6.根据权利要求3所述的方法，其中，所述语音输入与任务相关联，并且所述生成所述至少一个补充响应包括：

在接收所述语音输入期间生成对所述语音输入的预测；

基于所述预测来识别所述任务的意图；以及

基于所述任务的所述意图来生成所述至少一个补充响应。

7.根据权利要求6所述的方法，其中，所述生成所述主要响应包括：

在完成对所述语音输入的接收之后，基于所述语音输入来识别所述任务的所述意图；

基于所述任务的所述意图来执行所述任务；以及

基于执行所述任务的结果来生成所述主要响应。

8.根据权利要求1所述的方法，其中，所述时间段在完成对所述主要语音输出的提供的时间点和接收下一语音输入的时间点之间。

9.根据权利要求8所述的方法，其中，所述生成所述至少一个补充响应包括：

在生成所述主要响应的同时生成后续响应集合。

10.根据权利要求9所述的方法，其中，所述生成所述至少一个补充语音输出包括，对于所述后续响应集合中的每个后续响应：

在从先前语音输出开始的预定持续时间内，在所述音频上行流中执行语音活动检测；以及

如果通过所述语音活动检测没有检测到有效语音输入，则基于所述后续响应来生成后续语音输出。

11.根据权利要求10所述的方法，还包括：

如果通过所述语音活动检测而检测到有效语音输入，则停止基于所述后续响应集合来生成后续语音输出。

12.根据权利要求8所述的方法，其中，所述生成所述至少一个补充响应包括：

在生成了所述主要响应之后，通过多次迭代来递归地生成后续响应集合。

13.根据权利要求12所述的方法，其中，所述生成所述至少一个补充响应包括，对于所述多次迭代中的每次迭代：

在从先前语音输出开始的预定持续时间内，在所述音频上行流中执行语音活动检测；

如果通过所述语音活动检测没有检测到有效语音输入，则至少基于伪输入来生成后续响应，所述伪输入是与先前响应一起生成的；以及

至少基于所述语音输入来生成新的伪输入。

14.根据权利要求13所述的方法，还包括：

如果通过所述语音活动检测而检测到有效语音输入，则停止执行任何进一步的迭代。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司，未经微软技术许可有限责任公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201880085943.5/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]全双工语音对话中的多阶段响应有效

专利文献下载