[发明专利]自动地确定用于经由自动化助理接口接收的口头话语的语音辨识的语言有效
| 申请号: | 201880039579.9 | 申请日: | 2018-04-16 |
| 公开(公告)号: | CN111052229B | 公开(公告)日: | 2023-09-01 |
| 发明(设计)人: | 赵璞升;迭戈·米伦多·卡萨多;伊格纳西奥·洛佩斯·莫雷诺 | 申请(专利权)人: | 谷歌有限责任公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/00;G10L15/26;G10L15/183 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;邓聪惠 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自动 确定 用于 经由 自动化 助理 接口 接收 口头 话语 语音 辨识 语言 | ||
1.一种由一个或多个处理器实现的方法,所述方法包括:
接收与用户的口头话语相对应的音频数据,所述音频数据基于在客户端设备处对所述口头话语的检测,所述客户端设备包括用于与自动化助理交互的自动化助理接口;
使用与第一语言相对应的第一语音辨识模型来处理所述音频数据;
基于使用所述第一语音辨识模型来处理所述音频数据而确定响应于所述用户的口头话语的内容;
使所述客户端设备将所述内容渲染给所述用户,其中,所述内容包括索求来自所述用户的进一步输入的提示;
响应于确定所述内容包括所述提示,针对附加口头输入进行监视;
在所述监视期间接收与附加口头话语相对应的附加音频数据,所述附加音频数据基于通过所述客户端设备的所述自动化助理接口对所述附加口头话语的检测;
在确定要响应于所述附加口头话语而提供的进一步响应内容时,确定是利用针对所述第一语言的所述第一语音辨识模型还是针对第二语言的第二语音辨识模型,其中,在确定所述进一步响应内容时确定是利用所述第一语音辨识模型还是所述第二语音辨识模型是基于与用于针对来自所述用户的所述附加口头输入进行监视的时间段相对应的监视持续时间,其中,随着所述监视持续时间增加,利用所述第二语音辨识模型的概率增加;以及
使所述客户端设备渲染所述进一步响应内容。
2.根据权利要求1所述的方法,其中,在确定所述进一步响应内容时确定是利用所述第一语音辨识模型还是所述第二语音辨识模型是基于与所述用户的所述附加口头话语的持续时间相对应的输入持续时间。
3.根据权利要求2所述的方法,其中,随着所述输入持续时间增加,利用所述第二语音辨识模型的概率增加。
4.根据权利要求2所述的方法,还包括:
基于所述提示来识别用于所述附加口头话语的预期持续时间;
其中,基于所述输入持续时间来确定是利用所述第一语音辨识模型还是所述第二语音辨识模型是基于所述预期持续时间与所述输入持续时间的比较,并且随着基于所述比较的差增加,利用所述第二语音辨识模型的所述概率增加。
5.根据权利要求1所述的方法,其中,在确定所述进一步响应内容时确定是利用所述第一语音辨识模型还是所述第二语音辨识模型是基于用于所述附加口头话语的预期输入类型。
6.根据权利要求5所述的方法,其中,在确定所述进一步响应内容时确定是利用所述第一语音辨识模型还是所述第二语音辨识模型包括:
针对所述用户识别第一量度,所述第一量度基于所述用户响应于所述预期输入类型的过去提示而以所述第一语言进行的过去输入;
针对所述用户识别第二量度,所述第二量度基于所述用户响应于所述预期输入类型的过去提示而以所述第二语言进行的过去输入;以及
基于所述第一量度和所述第二量度来确定是利用所述第一语音辨识模型还是所述第二语音辨识模型。
7.根据权利要求6所述的方法,还包括:
基于所述音频数据或者基于来自所述客户端设备的一个或多个附加传感器的附加传感器数据来识别用于所述用户的用户简档;
其中,针对所述用户识别所述第一量度和所述第二量度是基于所述第一量度和所述第二量度与所述用户简档关联地被存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880039579.9/1.html,转载请声明来源钻瓜专利网。





