[发明专利]一种基于一类分类的轻量级语音欺骗检测算法在审

申请号：	202210193172.X	申请日：	2022-03-01
公开（公告）号：	CN114566170A	公开（公告）日：	2022-05-31
发明（设计）人：	彭海朋;任叶青;李丽香;赵洁;薛晓鹏;赵猛猛;孟寅;暴爽	申请（专利权）人：	北京邮电大学
主分类号：	G10L17/04	分类号：	G10L17/04;G10L17/14;G10L25/51;G06V10/774;G06V10/764
代理公司：	北京挺立专利事务所(普通合伙) 11265	代理人：	高福勇
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于一类分类轻量级语音欺骗检测算法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于一类分类的轻量级语音欺骗检测算法，其特征在于，利用知识蒸馏框架，通过基于分散损失的一类分类损失函数DOC-Softmax来学习一个特征空间，在这个特征空间中，真实语音嵌入有一个紧实的边界，欺骗语音与真实语音之间有一定的距离，同时在欺骗语音特征空间中引入分散损失来最大化每个欺骗语音样本到其中心的距离，从而使欺骗语音覆盖整个欺骗语音的空间。

2.根据权利要求1所述的基于一类分类的轻量级语音欺骗检测算法，其特征在于，基于分散损失的一类分类损失函数DOC-Softmax总的损失函数L_DOCS为一类分类损失L_OCS和分散损失L_D的加权和，权重为λ，具体公式如下：

其中，是权重向量，为w₀的标准化表示，为真实语音的优化方向，α是一个缩放因子，两个间隔m₀和m₁分别被引入来限定真实语音、欺骗语音与真实语音权重向量之间的角度，即与间的角度θ_i，m₀,m₁∈[-1,1],m₀＞m₁；

一类分类损失函数OC-Softmax的公式如下：

两个间隔m₀和m₁，m₀,m₁∈[-1,1],m₀＞m₁，分别被引入来限定真实类和欺骗类样本与间的角度θ_i，当y_i＝0，m₀用于使θ_i小于arccosm₀；当y_i＝1，m₁用于使θ_i大于arccosm₁，一个小的arccosm₀使目标类聚集在权重向量w₀，一个相对大的arccosm₁使非目标类远离权重向量w₀；

引入分散损失的公式如下：

其中，为嵌入向量，为x的标准化表示，y_i∈{0,1}为第i个样本的标签，y_i＝0表示该样本为真实语音，y_i＝1表示该样本为欺骗语音，N为一个批次中的样本数量，M为一个批次中欺骗样本的数量，ε为一个很小的常数，用来避免出现分母为0的情况，为每个批次中欺骗样本的中心，分散损失L_D是为了最大化欺骗语音样本与他们中心μ的距离，使欺骗语音尽可能的覆盖整个欺骗区域。

3.根据权利要求2所述的基于一类分类的轻量级语音欺骗检测算法，其特征在于，α＝20，m₀＝0.9，m₁＝0.2。

4.根据权利要求2所述的基于一类分类的轻量级语音欺骗检测算法，其特征在于，当语音样本为真实语音时，即y_i＝0时，m₀用于使θ_i小于arccosm₀，一个小的arccosm₀使真实语音聚集在权重向量w₀附近；当语音样本为欺骗语音时，即y_i＝1时，m₁用于使θ_i大于arccosm₁，一个相对大的arccosm₁使欺骗语音远离权重向量w₀。

5.根据权利要求1所述的基于一类分类的轻量级语音欺骗检测算法，其特征在于，教师模型采用基于深度残差网络ResNet-18的网络结构，并且使用注意力池化替代全局平均池化。

6.根据权利要求1所述的基于一类分类的轻量级语音欺骗检测算法，其特征在于，教师模型以提取的LFCC特征作为输入，以全连接层输出的结果作为输入语音的嵌入。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210193172.X/1.html，转载请声明来源钻瓜专利网。

上一篇：一种淋巴细胞染色体核型制片方法
下一篇：基于统计信息的多尺度多相岩心结构模拟退火建模方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于一类分类的轻量级语音欺骗检测算法在审

专利文献下载