[发明专利]识别声纹的方法及设备有效

申请号：	201710434570.5	申请日：	2017-06-09
公开（公告）号：	CN107610708B	公开（公告）日：	2018-06-19
发明（设计）人：	王健宗;罗剑;郭卉;肖京	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L17/04	分类号：	G10L17/04;G10L17/02;G10L17/06
代理公司：	深圳中一专利商标事务所 44237	代理人：	官建红
地址：	518000 广东省深***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明适用于互联网技术领域，提供了一种识别声纹的方法及设备，该方法包括：建立并训练通用识别模型，所述通用识别模型用于表示预设通信媒介下语音特征的分布；获取所述预设通信媒介下的语音数据；根据所述语音数据构建对应的所述声纹向量；根据所述通用识别模型确定所述声纹向量对应的所述声纹特征。本发明通过构建和训练通用识别模型对语音数据进行处理，得到对应的声纹向量，从而确定声纹特征，并根据声纹特征识别发出声音的人，由于通用识别模型不限制声音的内容，因此使本声纹识别的使用比较灵活，增多了声纹识别的使用场景。 1
搜索关键词：	声纹声纹特征语音数据通用向量声纹识别通信媒介构建预设互联网技术模型确定使用场景语音特征灵活
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种识别声纹的方法，其特征在于，包括：建立并训练通用识别模型，所述通用识别模型用于表示预设通信媒介下语音特征的分布，所述通用识别模型为一组与说话人无关的语音特征分布，所述建立并训练通用识别模型，包括：建立初始识别模型；根据迭代算法训练所述初始识别模型，以获得所述通用识别模型，所述根据迭代算法训练所述初始识别模型，以获得所述通用识别模型，包括：根据所述初始识别模型获取用多个正态分布表示的当前声纹向量对应的似然概率p，其中，x表示当前语音数据，λ表示模型参数，所述模型参数包括ωi、μi和Σi，ωi表示第i个正态分布的权重，μi表示第i个正态分布的均值，Σi表示第i个正态分布的协方差矩阵，pi表示由第i个正态分布生成所述当前语音数据的概率，M为采样点的数量；根据公式计算第i个正态分布的概率，其中，D表示当前声纹向量的维度；选择ωi、μi和Σi的参数数值以使对数似然函数L最大；获取每一步迭代更新的模型参数：其中，i代表第i个正态分布，ωi′是更新后的所述第i个正态分布的权重，μi′是更新后的均值，Σ′i是更新后的所述协方差矩阵，θ为声纹向量与水平线的夹角；根据公式获取第i个正态分布的后验概率，其中，所述多个正态分布的后验概率之和为所述迭代后的通用识别模型；获取所述预设通信媒介下的语音数据；根据所述语音数据构建对应的所述声纹向量；根据所述通用识别模型确定所述声纹向量对应的所述声纹特征，包括：对所述声纹向量进行解耦和；利用多个图形处理单元并行处理所述声纹向量，以获取多个处理结果；合并所述多个处理结果，以确定所述声纹特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于平安科技（深圳）有限公司，未经平安科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710434570.5/，转载请声明来源钻瓜专利网。

上一篇：商品销售数据处理装置、信息终端及其控制方法
下一篇：氯乙烯树脂组合物以及绝缘电线和电缆

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]识别声纹的方法及设备有效

专利文献下载