[发明专利]用于说话者验证的神经网络在审
申请号: | 201680028481.4 | 申请日: | 2016-07-27 |
公开(公告)号: | CN107924682A | 公开(公告)日: | 2018-04-17 |
发明(设计)人: | 乔治·海戈尔德;萨米·本希奥;伊格纳西奥·洛佩斯·莫雷诺 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/18;G10L17/02 |
代理公司: | 中原信达知识产权代理有限责任公司11219 | 代理人: | 李宝泉,周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 说话 验证 神经网络 | ||
1.一种计算机实现的方法,包括:
在计算装置处接收表征所述计算装置的用户的话语的数据;
在所述计算装置处使用所述计算装置上的神经网络来生成所述话语的说话者表示,其中,已经基于多个训练样本训练了所述神经网络,所述多个训练样本中的每个训练样本:
(i)包括表征第一话语的数据和表征一个或者多个第二话语的数据,以及
(ii)根据所述第一话语的说话者是否与所述一个或者多个第二话语的说话者相同而被标记为匹配样本或者非匹配样本;
在所述计算装置处访问所述计算装置的授权用户的说话者模型;以及
在所述计算装置处相对于所述说话者模型对所述话语的所述说话者表示进行评估以确定所述话语是否可能由所述计算装置的所述授权用户说出。
2.根据权利要求1所述的计算机实现的方法,其中,通过从与不同说话者对应的多组话语中选择所述第一话语和所述一个或者多个第二话语来生成所述多个训练样本中的每个训练样本,从而使得每组话语仅由相应组话语的对应说话者的话语组成。
3.根据权利要求1或者2所述的计算机实现的方法,进一步包括:
获得所述计算装置的所述授权用户的话语集合;
将来自所述话语集合的每个话语输入到所述神经网络中以生成所述话语的相应说话者表示;以及
基于所述授权用户的所述话语集合中的所述话语的相应说话者表示的平均数来生成所述计算装置的所述授权用户的所述说话者模型。
4.根据任何前述权利要求所述的计算机实现的方法,其中,训练所述神经网络所基于的所述多个训练样本中没有一个训练样本包括表征所述计算装置的用户的话语的数据。
5.根据任何前述权利要求所述的计算机实现的方法,其中,在所述计算装置处生成所述话语的所述说话者表示包括:在单次通过所述神经网络时利用所述神经网络来处理表征整个所述话语的数据。
6.根据任何前述权利要求所述的计算机实现的方法,进一步包括:响应于确定所述用户的所述话语可能由所述计算装置的所述授权用户说出而在所述计算装置上执行功能。
7.一种计算机实现的方法,包括:
基于第一话语集合的神经网络的输出来确定特定说话者的说话者模型,所述第一集合包括所述特定说话者的多个不同话语;
基于不在所述第一话语集合中的特定话语的神经网络的输出来确定说话者表示;
将所述说话者表示与所述特定说话者的所述说话者模型相比较以将所述特定话语分类为所述特定说话者的话语或者不同于所述特定说话者的说话者的话语;以及
基于将所述话语分类为所述特定说话者的话语或者不同于所述特定说话者的说话者的话语是否正确来调整所述神经网络。
8.根据权利要求7所述的计算机实现的方法,进一步包括:
在计算系统处选择多个不同话语集合作为用于训练所述神经网络的训练数据,每个话语集合包括:
(i)相应话语集合的第一说话者的多个不同第一话语,以及
(ii)相应话语集合的所述第一说话者或者相应话语集合的不同于所述第一说话者的第二说话者的第二话语;以及
使用所述多个不同话语集合来迭代地训练所述神经网络,其中,来自所述多个不同话语集合的每个话语集合用于训练所述神经网络的不同训练迭代,
其中,所述第一话语集合选自所述多个不同话语集合,其中,所述特定说话者是所述第一话语集合的所述第一说话者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680028481.4/1.html,转载请声明来源钻瓜专利网。