[发明专利]基于多分辨率的听觉感知语音特征参数提取方法在审

专利信息
申请号: 201910297406.3 申请日: 2019-04-15
公开(公告)号: CN110010150A 公开(公告)日: 2019-07-12
发明(设计)人: 林琳;孙晓颖;陈建;刘璐;于帆;王知强;张骞;武艺 申请(专利权)人: 吉林大学
主分类号: G10L21/0272 分类号: G10L21/0272;G10L21/0308;G10L25/03;G10L25/21
代理公司: 吉林长春新纪元专利代理有限责任公司 22100 代理人: 魏征骥
地址: 130012 吉*** 国省代码: 吉林;22
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音特征参数提取 分辨率特征 压缩滤波器 动态参数 多分辨率 听觉感知 语音 自适应 分辨率 耳蜗 掩蔽 语音信号处理 分离目标 分离特征 分离效果 分离性能 平滑处理 输入语音 特征参数 研究对象 语音感知 噪声环境 可懂度 滤波 时频 组对 联合
【权利要求书】:

1.一种基于多分辨率的听觉感知语音特征参数提取方法,其特征在于:包括下列步骤:

(1)、语音信号的预处理

语音信号的预处理过程包括将输入信号、采样率调整为Fs、端点检测、对输入数据幅度进行规整、预加重,得到预处理后信号xx(n),n=1,2,...N,其中N为输入信号长度;

(2)、对预处理后的信号xx(n),n=1,2,...N进行自适应压缩Gammachirp听觉滤波器组滤波,得到M通道的滤波信号xGc(i,j),i=1,...,M,j=1,...,N,其中M为自适应压缩Gammachirp听觉滤波器组的滤波器个数,N为输入信号长度;

(3)、计算不同分辨率下的耳蜗谱

根据设定的不同帧长,对M通道的滤波信号xGc(i,j),i=1,...M,j=1,...,N,计算每通道每帧信号的功率谱,提取不同分辨率下的对数耳蜗谱特征WCGc_ARMA;得到多分辨率的听觉感知特征参数

其中,C(m)是WCGc第m帧的特征向量,是多分辨率的听觉感知特征参数的WCGc_ARMA第m帧经过滤波后的特征向量,P为ARMA平滑滤波器的阶数。

2.根据权利要求1所述的一种基于多分辨率的听觉感知语音特征参数提取方法,其特征在于:步骤(2)的具体步骤如下:

1)计算每个通道的pGC(passive Gammachirp)滤波器频率响应gc(i,t),i=1,...,M

其中,时间t>0,a为振幅;阶次n1与参数b1是定义Gamma函数分布情况的参数,c1为啁啾因子(chirp factor);φ1是初始相位,fr1是pGC滤波器的中心频率,其按照ERB的关系,在给定频率范围之内分布,ERB(fr1)是中心频率为fr1的听觉滤波器等效矩形带宽的值,由下式计算得到;

ERB(fr1)=24.7+0.108fr1 (2)

2)利用每个通道的频率响应gc(i,t),i=1,...,M对输入信号xx(n),n=1,2,...N进行滤波,得到每个通道滤波后信号s1(i,j),i=1,...,M,j=1,...,N;

3)采用四个二阶IIR滤波器的级联近似实现HP-AF滤波器,在Z平面第k个IIR滤波器的频率响应为:

其中:

rk=exp{-p1(p0/p4)k-1·2πbERB(fr2)/Fs} (4)

△fr=(p0·p4)k-1·p2·c2·b2·ERB(fr2) (5)

式中Fs是信号的采样率,系数p0、p1、p2、p3、p4由下面公式得到:

p0=2,p4=1.0724

p1=1.7818·(1-0.0791·b2)·(1-0.1655·|c2|) (8)

p2=0.5689·(1-0.1621·b2)·(1-0.0857·|c2|) (9)

p3=0.2523·(1-0.0244·b2)·(1+0.0574·|c2|) (10)

其中,fr2是HP-AF滤波器的中心频率,它依赖于被动Gammachirp滤波器对信号的响应输出,可以定义为:

fr2=fratL×fp1 (11)

其中:

fratL=fratL(0)+fratL(1)×Pgcp (12)

fp1=fr1+c1b1ERB(fr1)/n1 (13)

HP-AF滤波器的中心频率fr2可以由频率比率fratL和被动Gammachirp滤波器的峰值频率fp1的乘积计算得到,其中,fratL(0)和fratL(1)为常数,Pgcp是被动Gammachirp滤波器输出的总强度,被用来控制高通非对称函数HP-AF的位置;

4)对pGC滤波后信号s1(i,j),i=1,...,M,j=1,...,N进行HP-AF滤波器,得到输出信号s2(i,j),i=1,...,M,j=1,...,N;

5)强度估计,设第i通道pGC和HP-AF在强度估计路径中的输出分别是s1(i,j)和s2(i,j),那么估计的线性等级和可以定义为:

其中△j是通道位移;△t是采样时间;τL是指数式衰减的半衰期,控制强度Pc(i,j)定义为线性强度的加权和,单位为分贝;

其中wL、v1L、v2L是加权参数,aRL是参数a的参考强度,单位是分贝;

6)利用控制强度Pc(i,j)对高通非对称滤波器HP-AF的频率比率进行自适应计算,得到强度自适应的频率比率frat

frat=fratL(0)+fratL(1)×Pc(i,j) (18)

其中fratL(0)和fratL(1)为常数;

7)利用高通非对称滤波器HP-AF对信号s2(i,j),i=1,...,M,j=1,...,N进行滤波,得到最终的滤波信号xGc(i,j),i=1,...,M,j=1,...,N,这里使用的高通非对称滤波器HP-AF滤波器参数的取值与前面强度估计时参数的设置基本相同,唯一不同的就是强度估计过程中的频率比率fratL是强度独立的;在这里滤波过程中的频率比率frat,它是主要的强度自适应参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910297406.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top