[发明专利]一种说话人验证系统及其重放攻击检测方法有效
申请号: | 202010395097.6 | 申请日: | 2020-05-12 |
公开(公告)号: | CN111611566B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 窦勇强;杨茂林;杨皓程 | 申请(专利权)人: | 珠海造极智能生物科技有限公司 |
主分类号: | G06F21/32 | 分类号: | G06F21/32;G10L17/02;G10L17/04;G10L17/18;G10L17/22;G06N3/04;G06N3/084 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;麦小婵 |
地址: | 519000 广东省珠海市高新区唐家湾镇金唐*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 说话 验证 系统 及其 重放 攻击 检测 方法 | ||
1.一种说话人验证系统的重放攻击检测方法,其特征在于,包括:分别提取待测语音信号的MGD-gram 特征、STFT-gram 特征和CQT-gram 特征;
将所述待测语音信号的MGD-gram 特征输入到训练好的具有平衡焦点损失函数的第一端到端残差网络模型,获得第一得分;
将所述待测语音信号的STFT-gram 特征输入到训练好的具有平衡焦点损失函数的第二端到端残差网络模型,获得第二得分;
将所述待测语音信号的CQT-gram 特征输入到训练好的具有平衡焦点损失函数的第三端到端残差网络模型,获得第三得分;
采用确定好的融合方式融合所述第一得分、所述第二得分和所述第三得分,并根据融合后的得分输出重放攻击检测结果;
其中,通过以下方式训练具有平衡焦点损失函数的第一端到端残差网络模型、第二端到端残差网络模型和第三端到端残差网络模型;
其中,所述具有平衡焦点损失函数的端到端残差网络模型的输出为得分;
通过补长/截断的方式对训练集语音信号进行预处理;
提取预处理后的所述训练集语音信号的特征;
将所述特征输入到具有残差连接的CNN 模型或者采用具有特征通道建模能力的SENet网络,进行高层次特征的提取;
将所述高层次特征通过非线性全连接层+softmax层,计算所述高层次特征的概率分布;
根据所述高层次特征的概率分布,通过如下所示的平衡焦点损失函数进行损失的计算,通过反向传播训练模型;
;
其中, ,分别代表权重系数和高层次特征的概率分布;
其中,所述确定好的融合方式具体是:
分别对所述具有平衡焦点损失函数的第一端到端残差网络模型、第二端到端残差网络模型和第三端到端残差网络模型的输出结果进行打分,并通过平均值融合方式或逻辑回归融合方式融合所述第一端到端残差网络模型、所述第二端到端残差网络模型和所述第三端到端残差网络模型的得分;根据所述得分,通过EER 标准和t-DCF 标准确定融合方式。
2.根据权利要求1所述的说话人验证系统的重放攻击检测方法,其特征在于,所述MGD-gram 特征通过以下步骤提取得到:
设输入语音信号为
对倒谱平滑操作,得到;
计算,其中λ为参数;
按下式计算修正群延迟函数,得到一帧特征;
,其中p为参数;
对分出来的每一帧语音信号重复上述步骤的计算,并在时间维度上拼接每一帧特征,得到MGD-gram 特征。
3.据权利要求1所述的说话人验证系统的重放攻击检测方法,其特征在于,在获得所述确定的融合方式之前,包括:
通过平均值融合方式或逻辑回归融合方式融合所述第一端到端残差网络模型、所述第二端到端残差网络模型和所述第三端到端残差网络模型的得分;
根据所述得分,通过EER 标准和t-DCF 标准确定融合方式。
4.根据权利要求3所述的说话人验证系统的重放攻击检测方法,其特征在于,当所述融合方式为逻辑回归融合方式时,通过以下方式计算具有平衡焦点失函数的端到端残差网络模型的权重和偏移量:
将训练集语音信号进行线性变换得到预测的输出结果BFL值;
计算所述模型的损失函数J(w,b);其中,w 为所述模型中涉及到的权重,b 为偏移量;
根据所述预测的输出结果BFL值,计算损失函数的梯度;
根据下述公式更新权重w和偏移量b;
;
,其中J为损失函数,α为学习率;
在迭代次数内,再重复上述步骤,直到导数得到最小化的代价函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海造极智能生物科技有限公司,未经珠海造极智能生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010395097.6/1.html,转载请声明来源钻瓜专利网。