[发明专利]自然语言虚拟助理中的全双工话语处理有效
| 申请号: | 201710843341.9 | 申请日: | 2017-09-18 |
| 公开(公告)号: | CN108228131B | 公开(公告)日: | 2021-03-19 |
| 发明(设计)人: | 郝司格;莫伯耐;华艾斯 | 申请(专利权)人: | 声音猎手公司 |
| 主分类号: | G06F40/35 | 分类号: | G06F40/35;G10L15/22;G10L15/30 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 桑敏 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自然语言 虚拟 助理 中的 双工 话语 处理 | ||
本公开涉及自然语言虚拟助理中的全双工话语处理。查询处理系统处理表示用户所说的一连串查询的输入音频流。查询处理系统持续监听输入音频流、解析查询并在中间流中采取适当的动作。在一些实施例中,系统并行地处理查询,这受串行约束限制。在一些实施例中,系统在在先查询的执行仍在进行中时解析并执行查询。为了适应倾向于慢慢讲话并在单独的部分中表达想法的用户,查询处理系统在其检测到新的语音话语改变了在先查询的含义时,停止输出与在先查询相对应的结果。
技术领域
本公开的实施例总体涉及用于在自然语言虚拟助理中向用户提供对用户的语音输入的更直观的响应的计算机实现的方法。
分类领域:704/246
背景技术
在常规系统中,人与虚拟助理或其他自然语言处理系统之间的人机对话具有严格的轮替策略。这类虚拟助理在将其对上一查询的响应完全传输至用户之前不接收新的查询。这种灵活性的欠缺导致沟通不自然。
发明内容
根据本公开实施例的一个方面,公开了一种用于产生对语音输入的响应的计算机实现的方法,该方法包括:获得音频输入流;在音频输入流中检测第一话语的开始;在音频输入流中检测第一话语的结束;响应于检测到第一话语的结束,启动对第一话语的处理以识别第一查询;以及在处理第一话语的同时:继续接收音频输入流;并且在音频输入流中检测第二话语的开始。
根据本公开实施例的另一方面,公开了一种存储用于生成对语音输入的响应的指令的非暂态计算机可读存储介质,所述指令在由计算机处理器执行时执行动作,所述动作包括:获得音频输入流;在音频输入流中检测第一话语的开始;在音频输入流中检测第一话语的结束;响应于检测到第一话语的结束,启动对第一话语的处理以识别第一查询;以及在处理第一话语的同时:继续接收音频输入流;并且在音频输入流中检测第二话语的开始。
附图说明
图1示出了根据一个实施例的其中发生查询处理的系统环境。
图2示出了根据一个实施例的查询处理模块的组件。
图3-10是示出了根据各种实施例的在不同场景中随时间处理用户语音的图示。
图11是示出了根据一个实施例的用作图1的查询处理服务器或客户端设备的部分或全部的计算机的物理组件的高级框图。
附图描绘了本发明的各种实施例,仅用于说明的目的。本领域的技术人员将从下面的描述中容易地认识到,在不脱离本文描述的发明的原理的情况下,可以采用本文所示的结构和方法的其它替代实施例。
具体实施方式
图1示出了根据一个实施例的其中发生查询处理的系统环境。客户端设备110的用户使用语音来表达他们的希望,包括对动作的请求(例如,“创建今天下午7点与Karl共进晚餐的约会日程”)和对信息的请求(例如,“罗马明天是什么天气”)。
在图1所示的实施例中,查询处理发生在位于网络140远程的查询处理服务器100上。然而,在其他实施例中,查询处理在本地直接发生在客户端设备110上,例如作为安装在客户端设备上的虚拟助理应用的一部分。在一些实施例中,语音在客户端设备110本地被分割和转录,而在服务器 100上执行的处理在文本段上进行操作。在一些实施例中,服务器100分布在多个物理服务器上。
客户端设备110是计算设备(诸如智能电话、平板电脑、膝上型计算机或台式计算机)、或智能家电或其他设备(例如具有数据处理能力的汽车或咖啡机))、或可以输入自然语言查询并输出对查询的响应的任何其他设备。客户端设备110具有捕获声音并将其转换为数字音频数据的声音输入设备112(例如麦克风和A/D转换器)、以及将数字音频数据转换为相应的听觉输出的声音输出设备113,例如,D/A转换器和扬声器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于声音猎手公司,未经声音猎手公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710843341.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种嵌入式设备的液晶屏显示方法及装置
- 下一篇:语音启用装置及其中执行的方法





