[发明专利]一种声纹特征提取方法和电子设备有效
申请号: | 201510618651.1 | 申请日: | 2015-09-24 |
公开(公告)号: | CN105355206B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 许军 | 申请(专利权)人: | 车音智能科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L25/18 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 顾友 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 特征 提取 方法 电子设备 | ||
本发明公开了了一种声纹特征提取方法和电子设备,属于声纹识别领域,包括:获取与当前帧语音数据相邻的至少一帧语音数据的频率值;根据所有至少一帧语音数据的频率值,获取当前语音帧的频率值;根据当前语音帧的频率值,计算当前语音帧的声纹特征参数。通过根据与当前帧语音数据相邻的至少一帧语音数据的频率值作为当前语音帧的频率值,来获取当前语音值对应的声纹特征,不仅避免了由于帧内语音信号略微时移偏差而导致的频域信号的差异性,同时,避免了复杂的电话信道或者噪音环境对声纹识别率的影响,从而提高了声纹特征提取的稳态性,提高了声纹识别率。
技术领域
本发明涉及声纹识别领域,特别涉及一种声纹特征提取方法和电子设备。
背景技术
声纹识别技术是生物身份识别技术的一种,利用声音来验证话者的真实身份。而声纹特征提取是实现声纹识别的核心技术之一,随着声纹识别技术的普及,使得需要一种声纹特征提取方法,实现声纹特征的提取,保证声纹识别技术的实现。
现有技术提供了一种声纹特征提取方法,通过按照固定帧长和帧移,对语音信号进行分帧,在每帧语音信号内提取短时声纹特征。现有即时还提供了一种声纹特征提取方法,通过计算固定语音帧的Pitch(基频);根据Pitch的数值来确定当前帧的帧长;按照该帧长与帧移对语音信号进行分帧,在每帧语音信号内提取短时声纹特征。
但是,由于不同的人,不同的发音,其信号的周期性是不固定的,,会导致某些语音信号在帧内不具有周期性,是得在采用现有技术一所提供的方法时,会降低声纹特征的稳态性。同时,由于在复杂的电话信道或者噪音环境下,Pitch的提取变得非常困难,很多语音帧无法得到正确的数值,使得在采取现有技术二所提供的方法时,会降低声纹识别率。
发明内容
为了提高声纹特征提取的稳态性,提高声纹识别率,本发明实施例提供了一种声纹特征提取方法和电子设备。所述技术方案如下:
第一方面,提供了一种声纹特征提取方法,所述方法包括:
获取与当前帧语音数据相邻的至少一帧语音数据的频率值;
根据所有所述至少一帧语音数据的频率值,获取所述当前语音帧的频率值;
根据所述当前语音帧的频率值,计算所述当前语音帧的声纹特征参数。
第二方面,提供了一种电子设备,所述电子设备包括:
获取模块,用于获取与当前帧语音数据相邻的至少一帧语音数据的频率值;
第一处理模块,用于根据所有所述至少一帧语音数据的频率值,获取所述当前语音帧的频率值;
第二处理模块,用于根据所述当前语音帧的频率值,计算所述当前语音帧的声纹特征参数。
第三方面,提供了一种电子设备,所述电子设备包括录音装置、存储器以及与所述录音装置、所述存储器连接的处理器,其中,所述存储器用于存储一组程序代码,所述处理器调用所述存储器所存储的程序代码用于执行以下操作:
获取与当前帧语音数据相邻的至少一帧语音数据的频率值;
根据所有所述至少一帧语音数据的频率值,获取所述当前语音帧的频率值;
根据所述当前语音帧的频率值,计算所述当前语音帧的声纹特征参数;
其中,所述语音数据是所述处理器调用所述存储器所存储的程序代码通过执行以下操作中的任意一个获取的:
控制从所述录音装置获取所述语音数据;或者,
从语音文件中获取所述语音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于车音智能科技有限公司,未经车音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510618651.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:密集防潮光盘安全存储柜
- 下一篇:一种基于FPGA的多模式图像显示控制方法