[发明专利]一种基于一类分类的轻量级语音欺骗检测算法在审
| 申请号: | 202210193172.X | 申请日: | 2022-03-01 |
| 公开(公告)号: | CN114566170A | 公开(公告)日: | 2022-05-31 |
| 发明(设计)人: | 彭海朋;任叶青;李丽香;赵洁;薛晓鹏;赵猛猛;孟寅;暴爽 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/14;G10L25/51;G06V10/774;G06V10/764 |
| 代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 高福勇 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 一类 分类 轻量级 语音 欺骗 检测 算法 | ||
1.一种基于一类分类的轻量级语音欺骗检测算法,其特征在于,利用知识蒸馏框架,通过基于分散损失的一类分类损失函数DOC-Softmax来学习一个特征空间,在这个特征空间中,真实语音嵌入有一个紧实的边界,欺骗语音与真实语音之间有一定的距离,同时在欺骗语音特征空间中引入分散损失来最大化每个欺骗语音样本到其中心的距离,从而使欺骗语音覆盖整个欺骗语音的空间。
2.根据权利要求1所述的基于一类分类的轻量级语音欺骗检测算法,其特征在于,基于分散损失的一类分类损失函数DOC-Softmax总的损失函数LDOCS为一类分类损失LOCS和分散损失LD的加权和,权重为λ,具体公式如下:
其中,是权重向量,为w0的标准化表示,为真实语音的优化方向,α是一个缩放因子,两个间隔m0和m1分别被引入来限定真实语音、欺骗语音与真实语音权重向量之间的角度,即与间的角度θi,m0,m1∈[-1,1],m0>m1;
一类分类损失函数OC-Softmax的公式如下:
两个间隔m0和m1,m0,m1∈[-1,1],m0>m1,分别被引入来限定真实类和欺骗类样本与间的角度θi,当yi=0,m0用于使θi小于arccosm0;当yi=1,m1用于使θi大于arccosm1,一个小的arccosm0使目标类聚集在权重向量w0,一个相对大的arccosm1使非目标类远离权重向量w0;
引入分散损失的公式如下:
其中,为嵌入向量,为x的标准化表示,yi∈{0,1}为第i个样本的标签,yi=0表示该样本为真实语音,yi=1表示该样本为欺骗语音,N为一个批次中的样本数量,M为一个批次中欺骗样本的数量,ε为一个很小的常数,用来避免出现分母为0的情况,为每个批次中欺骗样本的中心,分散损失LD是为了最大化欺骗语音样本与他们中心μ的距离,使欺骗语音尽可能的覆盖整个欺骗区域。
3.根据权利要求2所述的基于一类分类的轻量级语音欺骗检测算法,其特征在于,α=20,m0=0.9,m1=0.2。
4.根据权利要求2所述的基于一类分类的轻量级语音欺骗检测算法,其特征在于,当语音样本为真实语音时,即yi=0时,m0用于使θi小于arccosm0,一个小的arccosm0使真实语音聚集在权重向量w0附近;当语音样本为欺骗语音时,即yi=1时,m1用于使θi大于arccosm1,一个相对大的arccosm1使欺骗语音远离权重向量w0。
5.根据权利要求1所述的基于一类分类的轻量级语音欺骗检测算法,其特征在于,教师模型采用基于深度残差网络ResNet-18的网络结构,并且使用注意力池化替代全局平均池化。
6.根据权利要求1所述的基于一类分类的轻量级语音欺骗检测算法,其特征在于,教师模型以提取的LFCC特征作为输入,以全连接层输出的结果作为输入语音的嵌入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210193172.X/1.html,转载请声明来源钻瓜专利网。





