[发明专利]基于多分辨率的听觉感知语音特征参数提取方法在审
申请号: | 201910297406.3 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110010150A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 林琳;孙晓颖;陈建;刘璐;于帆;王知强;张骞;武艺 | 申请(专利权)人: | 吉林大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L25/03;G10L25/21 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 魏征骥 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音特征参数提取 分辨率特征 压缩滤波器 动态参数 多分辨率 听觉感知 语音 自适应 分辨率 耳蜗 掩蔽 语音信号处理 分离目标 分离特征 分离效果 分离性能 平滑处理 输入语音 特征参数 研究对象 语音感知 噪声环境 可懂度 滤波 时频 组对 联合 | ||
1.一种基于多分辨率的听觉感知语音特征参数提取方法,其特征在于:包括下列步骤:
(1)、语音信号的预处理
语音信号的预处理过程包括将输入信号、采样率调整为Fs、端点检测、对输入数据幅度进行规整、预加重,得到预处理后信号xx(n),n=1,2,...N,其中N为输入信号长度;
(2)、对预处理后的信号xx(n),n=1,2,...N进行自适应压缩Gammachirp听觉滤波器组滤波,得到M通道的滤波信号xGc(i,j),i=1,...,M,j=1,...,N,其中M为自适应压缩Gammachirp听觉滤波器组的滤波器个数,N为输入信号长度;
(3)、计算不同分辨率下的耳蜗谱
根据设定的不同帧长,对M通道的滤波信号xGc(i,j),i=1,...M,j=1,...,N,计算每通道每帧信号的功率谱,提取不同分辨率下的对数耳蜗谱特征WCGc_ARMA;得到多分辨率的听觉感知特征参数
其中,C(m)是WCGc第m帧的特征向量,是多分辨率的听觉感知特征参数的WCGc_ARMA第m帧经过滤波后的特征向量,P为ARMA平滑滤波器的阶数。
2.根据权利要求1所述的一种基于多分辨率的听觉感知语音特征参数提取方法,其特征在于:步骤(2)的具体步骤如下:
1)计算每个通道的pGC(passive Gammachirp)滤波器频率响应gc(i,t),i=1,...,M
其中,时间t>0,a为振幅;阶次n1与参数b1是定义Gamma函数分布情况的参数,c1为啁啾因子(chirp factor);φ1是初始相位,fr1是pGC滤波器的中心频率,其按照ERB的关系,在给定频率范围之内分布,ERB(fr1)是中心频率为fr1的听觉滤波器等效矩形带宽的值,由下式计算得到;
ERB(fr1)=24.7+0.108fr1 (2)
2)利用每个通道的频率响应gc(i,t),i=1,...,M对输入信号xx(n),n=1,2,...N进行滤波,得到每个通道滤波后信号s1(i,j),i=1,...,M,j=1,...,N;
3)采用四个二阶IIR滤波器的级联近似实现HP-AF滤波器,在Z平面第k个IIR滤波器的频率响应为:
其中:
rk=exp{-p1(p0/p4)k-1·2πbERB(fr2)/Fs} (4)
△fr=(p0·p4)k-1·p2·c2·b2·ERB(fr2) (5)
式中Fs是信号的采样率,系数p0、p1、p2、p3、p4由下面公式得到:
p0=2,p4=1.0724
p1=1.7818·(1-0.0791·b2)·(1-0.1655·|c2|) (8)
p2=0.5689·(1-0.1621·b2)·(1-0.0857·|c2|) (9)
p3=0.2523·(1-0.0244·b2)·(1+0.0574·|c2|) (10)
其中,fr2是HP-AF滤波器的中心频率,它依赖于被动Gammachirp滤波器对信号的响应输出,可以定义为:
fr2=fratL×fp1 (11)
其中:
fratL=fratL(0)+fratL(1)×Pgcp (12)
fp1=fr1+c1b1ERB(fr1)/n1 (13)
HP-AF滤波器的中心频率fr2可以由频率比率fratL和被动Gammachirp滤波器的峰值频率fp1的乘积计算得到,其中,fratL(0)和fratL(1)为常数,Pgcp是被动Gammachirp滤波器输出的总强度,被用来控制高通非对称函数HP-AF的位置;
4)对pGC滤波后信号s1(i,j),i=1,...,M,j=1,...,N进行HP-AF滤波器,得到输出信号s2(i,j),i=1,...,M,j=1,...,N;
5)强度估计,设第i通道pGC和HP-AF在强度估计路径中的输出分别是s1(i,j)和s2(i,j),那么估计的线性等级和可以定义为:
其中△j是通道位移;△t是采样时间;τL是指数式衰减的半衰期,控制强度Pc(i,j)定义为线性强度的加权和,单位为分贝;
其中wL、v1L、v2L是加权参数,aRL是参数a的参考强度,单位是分贝;
6)利用控制强度Pc(i,j)对高通非对称滤波器HP-AF的频率比率进行自适应计算,得到强度自适应的频率比率frat;
frat=fratL(0)+fratL(1)×Pc(i,j) (18)
其中fratL(0)和fratL(1)为常数;
7)利用高通非对称滤波器HP-AF对信号s2(i,j),i=1,...,M,j=1,...,N进行滤波,得到最终的滤波信号xGc(i,j),i=1,...,M,j=1,...,N,这里使用的高通非对称滤波器HP-AF滤波器参数的取值与前面强度估计时参数的设置基本相同,唯一不同的就是强度估计过程中的频率比率fratL是强度独立的;在这里滤波过程中的频率比率frat,它是主要的强度自适应参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910297406.3/1.html,转载请声明来源钻瓜专利网。