[发明专利]一种基于AMBP的噪声鲁棒性伪装语音检测方法在审
申请号: | 202011102336.0 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112201258A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | 简志华;金易帆;钟华;孙闽红;朱雅楠;于佳祺 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L17/02;G10L17/20;G10L25/21;G10L25/45 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 ambp 噪声 鲁棒性 伪装 语音 检测 方法 | ||
本发明公开了一种基于AMBP的噪声鲁棒性伪装语音检测方法,包括:S11.将含噪声的语音转换为语谱图;S12.采用自适应中位数二进制模式AMBP算法对语谱图进行特征提取,得到语音的纹理特征向量;S13.利用得到的语音纹理特征向量训练支持向量机,得到语音分类模型,并利用语音分类模型对语音进行检测分类,得到分类结果。本发明大大提高了伪装语音检测的效果。
技术领域
本发明涉及语音分类技术领域,尤其涉及一种基于AMBP的噪声鲁棒性伪装语音检测方法。
背景技术
近年来,基于生物特征比如指纹、人脸和语音等的身份认证技术发展迅速,其中以语音作为生物身份特征的自动说话人认证技术有了很大的发展,是一种可靠的低成本的身份认证技术。但是一般的传统说话人认证技术容易受到恶意的伪装语音的攻击,使其识别准确率大大下降,近年来很多研究表明伪装语音对说话人认证系统具有很大的欺骗性,于是研究伪装语音检测方法就显得格外重要。伪装语音检测方法是通过对说话人的语音进行分析,提取语音信号的幅度谱特征或者相位谱特征,并采用鉴别器判决出它是真实说话人的语音还是伪装语音。实际情况下,系统面对的大都是未知的伪装语音的攻击,而使用传统的幅度谱特征或者相位谱特征时,效果往往不是很理想。并且大部分的伪装语音检测方法都是在高信噪比的环境下进行的,而实际应用时,待检测语音经常会包含噪声,这种情况下会使得伪装语音检测的效果大大下降。
因此,本发明提出一种基于AMBP的噪声鲁棒性伪装语音检测方法。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种基于AMBP的噪声鲁棒性伪装语音检测方法。
为了实现以上目的,本发明采用以下技术方案:
一种基于AMBP的噪声鲁棒性伪装语音检测方法,包括:
S1.将含噪声的语音转换为语谱图;
S2.采用自适应中位数二进制模式AMBP算法对语谱图进行特征提取,得到语音的纹理特征向量;
S3.利用得到的语音纹理特征向量训练支持向量机,得到语音分类模型,并利用语音分类模型对语音进行检测分类,得到分类结果。
进一步的,所述步骤S1具体包括:
S11.获取含噪声的语音;
S12.对获取的含噪声的语音中的语音信号进行分帧加窗处理,得到多帧短时语音信号,并对多帧短时语音信号中的每一帧语音信号进行快速傅里叶变换;
S13.计算进行快速傅里叶变换后的每一帧语音信号的能量谱密度,得到每一帧语音信号的能量谱密度;
S14.对得到的能量谱密度取对数,并进行灰度映射处理,得到含噪声的语音的语谱图。
进一步的,所述步骤S11中获取含噪声的语音,表示为:
x(n)=s(n)+d(n)
其中,x(n)表示含噪声的语音信号,s(n)表示纯净语音信号,d(n)表示噪声信号。
进一步的,所述步骤S12中对多帧短时语音信号中的每一帧语音信号进行快速傅里叶变换,表示为:
其中,m表示每一帧的采样点数,0<m<M-1;X(n,k)表示第n帧语音的频谱。
进一步的,所述步骤S13中得到每一帧语音信号的能量谱密度,表示为:
E(n,k)=|X(n,k)|2=XR(n,k)2+XI(n,k)2
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011102336.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种检测口臭的牙科治疗器械
- 下一篇:一种芯片贴装拾片夹头