[发明专利]来自智能扬声器的动态文本到语音响应在审

申请号：	201880034610.X	申请日：	2018-05-17
公开（公告）号：	CN110678921A	公开（公告）日：	2020-01-10
发明（设计）人：	J·阿尔德斯;宋祖揆;张绍勋;E·J·弗里曼	申请（专利权）人：	伯斯有限公司
主分类号：	G10L13/033	分类号：	G10L13/033;G10L15/22;G10L21/0364
代理公司：	11256 北京市金杜律师事务所	代理人：	董莘
地址：	美国马***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	扬声器情境意识服务提供方格式化为个人助理音频参数音频输出响应虚拟语音关联查询
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种操作与虚拟个人助理(VPA)服务提供方相关联的情境意识扬声器的方法，该方法包括接收对靠近该情境意识扬声器的环境的至少一个参数的指示；以及通过该情境意识扬声器的音频输出将格式化为语音的对声音查询的响应递送给用户，该响应的至少一个音频参数基于对该至少一个参数的指示来设置。

技术领域

本公开的各方面和实施方式整体涉及至少部分地基于智能扬声器周围的环境的一个或多个参数来定制智能扬声器对用户的命令或查询的响应。

背景技术

可以访问虚拟个人助理(VPA)服务的智能扬声器是这样的设备，该设备通过例如使用互联网搜索对用户查询的响应来响应于用户查询(该用户查询可以是口头查询的形式)，并且通常以可听响应(诸如合成语音)的形式向用户提供响应。可以访问VPA服务的智能扬声器还可响应于用户命令，以播放来自指定音频源(例如，互联网广播电台)的音频，或者控制智能设备，例如以打开或关闭灯或更改另一种智能设备的设置，智能扬声器可例如经由Wi-Fi信号直接访问或通过用户的互联网路由器访问该灯或该另一种智能设备。在用户按下按钮或说出唤醒词或短语(例如，“Alexa”)之后，用户通常通过智能扬声器或其他设备向VPA提供查询或命令，该唤醒词或短语向智能扬声器或其他设备指示用户正在对VPA说话。VPA使能设备在提供竞争设备的各种公司中变得越来越普遍，例如，来自亚马逊公司(Amazon)的设备，来自谷歌公司(Google)的Google设备，以及来自苹果公司(Apple)的结合有应用程序的各种设备。当前的智能扬声器尚未具有情境意识。它们缺乏例如检测其周围环境的参数(诸如人的位置、智能扬声器周围的人的数量、或环境噪声等级)的能力。当前的智能扬声器无法基于环境参数来定制对用户查询或命令的VPA响应。

发明内容

根据本公开的一方面，提供了操作情境意识扬声器的方法。该方法包括接收对靠近情境意识扬声器的环境的至少一个参数的指示，从虚拟个人助理接收在情境意识扬声器处的音频信息，以及基于至少一个参数的指示修改音频信息。接收音频信息可包括接收对用户向情境意识扬声器说出的查询的音频响应。该方法还可包括通过情境意识扬声器呈现音频响应。

在一些实施方式中，该方法包括通过基于对至少一个参数的指示设置响应的音量来修改音频信息。至少一个参数可以是查询的音量、由情境意识扬声器的音频传感器感测的背景噪声的音量、或用户的身份中的一个或多个。

修改音频信息可包括调整音频信息的音量、音调、均衡、音调或呈现速度中的一个或多个。至少一个参数可包括以下各项中的一个或多个：提供给情境意识扬声器的查询的音量、背景噪声的音量、背景噪声的频谱、用户的身份、用户的位置、当日时间、靠近情境意识扬声器的人的生理参数、用户对由情境意识扬声器提供的先前响应的响应、或靠近情境意识扬声器的一个或多个设备的活动状态。

在一些实施方式中，该方法包括基于用户的位置来设置响应的音量。该方法还包括基于用户的位置来选择通过其递送响应的扬声器，或者基于用户距情境意识扬声器的距离来设置响应的音量。

在一些实施方式中，该方法包括基于以下各项中的一个或多个来设置响应的音量：当日时间、在情境意识扬声器的听力距离内的人的生理参数、用户对由情境意识扬声器提供的先前响应的响应、或靠近情境意识扬声器的一个或多个设备的活动状态。

在一些实施方式中，该方法包括基于对至少一个参数的指示来设置响应的音调。该方法可包括将响应格式化为模拟耳语、模拟呼喊、或去除响应的低频分量之一。响应的音调可基于以下各项中的一个或多个来设置：声音查询的音量、由音频传感器感测的背景噪声的音量、用户的身份、用户的位置、当日时间、情境意识扬声器的听力距离内的人的生理参数、由音频传感器感测的背景噪声的频谱、或用户对由情境意识扬声器提供的先前响应的响应。

在一些实施方式中，该方法包括基于对至少一个参数的指示来设置响应的模拟语音的速度。可以基于声音查询的语音速度或用户的身份中的一个来设置响应的模拟语音的速度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于伯斯有限公司，未经伯斯有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201880034610.X/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]来自智能扬声器的动态文本到语音响应在审

专利文献下载