[发明专利]声纹识别方法及装置有效

申请号：	202110047207.4	申请日：	2021-01-14
公开（公告）号：	CN112820298B	公开（公告）日：	2022-11-22
发明（设计）人：	邓洪文;镇超;卞小香;吴多	申请（专利权）人：	中国工商银行股份有限公司
主分类号：	G10L17/00	分类号：	G10L17/00;G10L17/02;G10L17/04;G10L17/18;G10L17/20
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	任默闻;孙乳笋
地址：	100140 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	声纹识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供一种声纹识别方法及装置，也可用于金融领域，所述方法包括：采集用户音频文件并提取所述音频文件中的声纹特征信息；根据跨信道声纹识别模型对所述声纹特征信息进行声纹识别，得到所述声纹识别的结果，其中，所述跨信道声纹识别模型中包括根据不同测试样本类型配置对应注意力系数的损失函数模型，所述测试样本类型与所述音频文件所属信道对应；本申请能够有效提高跨信道场景下声纹识别的准确率。

技术领域

本申请涉及人工智能领域，也可用于金融领域，具体涉及一种声纹识别方法及装置。

背景技术

目前，人工智能技术广泛应用于各领域，尤其是在办公领域中的应用，将大量重复性流程剥离出主要业务流程，显著地提高了办公效率及正确率。在人工智能技术领域中，声纹识别技术正逐渐应用到银行业，典型应用场景为电话银行，电话银行呼叫中心使用声纹识别作为用户身份验证的辅助手段，并基于声纹识别技术搭建声纹黑名单，在抵制电话诈骗的场景下有着广阔的应用空间。

声纹识别应用在同信道时效果极佳，识别准确率往往可以达到98％以上，等错率(EER)也能达到0.01以下。在实际应用中，用户通过手机app注册声纹，再通过呼叫中心咨询业务。在此过程中，银行业务系统使用声纹识别来对用户的身份进行认证来保障业务安全。这就涉及到，通过手机app网络信道采集的采样率为16kHz的语音，与通过电话信道采集的采样率为8kHz的语音进行跨信道比对的问题(即跨信道场景)。

发明人发现，无论在现实应用中，还是在实验室采集数据测试中，现有技术中的声纹识别算法对这种跨信道的准确率都不高，由于跨信道场景是声纹识别在银行应用最为重要、最为广泛的场景，因此必须提高跨信道声纹识别算法的识别准确率。

发明内容

针对现有技术中的问题，本申请提供一种声纹识别方法及装置，能够有效提高提高跨信道场景下声纹识别的准确率。

为了解决上述问题中的至少一个，本申请提供以下技术方案：

第一方面，本申请提供一种声纹识别方法，包括：

采集用户音频文件并提取所述音频文件中的声纹特征信息；

根据跨信道声纹识别模型对所述声纹特征信息进行声纹识别，得到所述声纹识别的结果，其中，所述跨信道声纹识别模型中包括根据不同测试样本类型配置对应注意力系数的损失函数模型。

进一步地，在所述根据跨信道声纹识别模型对所述声纹特征信息进行声纹识别之前，包括：

根据不同测试样本类型确定对应的注意力系数，得到添加有所述注意力系数的损失函数模型；

根据所述损失函数模型构建时延神经网络模型，并通过预设带标签的短语音音频对所述时延神经网络模型进行分类训练，得到跨信道声纹识别模型。

进一步地，在所述通过预设带标签的短语音音频对所述时延神经网络模型进行分类训练，得到跨信道声纹识别模型之后，包括：

确定每次所述分类训练的识别分类误差；