[发明专利]说话者验证有效
申请号: | 201780003481.3 | 申请日: | 2017-07-06 |
公开(公告)号: | CN108140386B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | I.L.莫雷诺;万力;王泉 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/18 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽;陈茜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 说话 验证 | ||
1.一种系统,包括:
一个或多个计算机和存储指令的一个或多个存储装置,所述指令在通过一个或多个计算机执行时能操作为使得一个或多个计算机执行以下操作,包括:
通过用户装置接收代表用户言辞的音频数据;
将从与用户装置相关的语言识别符或地方识别符和所述音频数据获得的一组输入数据提供给存储在用户装置上的神经网络,该神经网络具有参数,所述参数使用代表不同语言或不同方言的话语的话语数据被训练;
基于响应于接收所述一组输入数据而产生的神经网络的输出,产生表示用户声音特点的说话者展示;
基于说话者展示和第二展示确定该言辞是所述用户的言辞;和
基于确定该言辞是所述用户的言辞而为用户提供对用户装置的访问。
2.如权利要求1所述的系统,其中从音频数据和所确定的语言识别符获得的所述一组输入数据包括从音频数据获得的第一向量和从与用户装置相关的语言识别符获得的第二向量。
3.如权利要求2所述的系统,进一步包括:
通过将第一向量和第二向量结合成为单个经结合向量而产生输入向量;
将所产生的输入向量提供到神经网络;和
基于响应于接收所述输入向量而产生的神经网络的输出,产生表示用户声音特点的说话者展示。
4.如权利要求2所述的系统,进一步包括:
通过将至少两个其他神经网络的输出结合而产生输入向量,所述至少两个其他神经网络分别基于(i)第一向量、(ii)第二向量、或(iii)第一向量和第二向量二者而产生输出;
将所产生的输入向量提供到神经网络;和
基于响应于接收所述输入向量而产生的神经网络的输出,产生表示用户声音特点的说话者展示。
5.如权利要求2所述的系统,进一步包括:
基于第一向量和第二向量的加权之和而产生输入向量;
将所产生的输入向量提供到神经网络;和
基于响应于接收所述输入向量而产生的神经网络的输出,产生表示用户声音特点的说话者展示。
6.如前述权利要求中任一项所述的系统,其中响应于接收所述一组输入数据产生的神经网络的输出包括通过神经网络的隐藏层产生的一组启用。
7.一种方法,包括:
通过用户装置接收代表用户言辞的音频数据;
将从与用户装置相关的语言识别符或地方识别符和所述音频数据获得的一组输入数据提供给存储在用户装置上的神经网络,该神经网络具有参数,所述参数使用代表不同语言或不同方言的话语的话语数据被训练;
基于响应于接收所述一组输入数据而产生的神经网络的输出,产生表示用户声音特点的说话者展示;
基于说话者展示和第二展示确定该言辞是所述用户的言辞;和
基于确定该言辞是所述用户的言辞而为用户提供对用户装置的访问。
8.如权利要求7所述的方法,其中从音频数据和所确定的语言识别符获得的所述一组输入数据包括从音频数据获得的第一向量和从与用户装置相关的语言识别符获得的第二向量。
9.如权利要求8所述的方法,进一步包括:
通过将第一向量和第二向量结合成为单个经结合向量而产生输入向量;
将所产生的输入向量提供到神经网络;和
基于响应于接收所述输入向量而产生的神经网络的输出,产生表示用户声音特点的说话者展示。
10.如权利要求8所述的方法,进一步包括:
通过将至少两个其他神经网络的输出结合而产生输入向量,所述至少两个其他神经网络分别基于(i)第一向量(ii)第二向量或(iii)第一向量和第二向量二者而产生输出;
将所产生的输入向量提供到神经网络;和
基于响应于接收所述输入向量而产生的神经网络的输出,产生表示用户声音特点的说话者展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780003481.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子设备和用于控制电子设备的方法
- 下一篇:软决策音频解码系统