[发明专利]基于多分辨率的听觉感知语音特征参数提取方法在审
申请号: | 201910297406.3 | 申请日: | 2019-04-15 |
公开(公告)号: | CN110010150A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 林琳;孙晓颖;陈建;刘璐;于帆;王知强;张骞;武艺 | 申请(专利权)人: | 吉林大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L25/03;G10L25/21 |
代理公司: | 吉林长春新纪元专利代理有限责任公司 22100 | 代理人: | 魏征骥 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于多分辨率的听觉感知语音特征参数提取方法,属于语音信号处理领域。以噪声环境下单通道输入语音信号为研究对象,通过对输入信号进行时频表示,在不同分辨率下提取基于自适应压缩滤波器组的对数耳蜗谱特征,并联合各分辨率特征及其动态参数,使用ARMA模型对特征进行平滑处理,来进一步提高语音分离性能。优点在于:采用掩蔽作为分离目标,特征参数的有效性对分离效果的影响,为提高分离后语音的可懂度提供了一个重要的理论依据;利用自适应压缩滤波器组对输入信号进行滤波,在不同分辨率下,提取每通道的对数耳蜗谱特征,并联合各分辨率特征及其动态参数,更好地提高分离特征的语音感知能力,进而提高语音分离的性能。 | ||
搜索关键词: | 语音特征参数提取 分辨率特征 压缩滤波器 动态参数 多分辨率 听觉感知 语音 自适应 分辨率 耳蜗 掩蔽 语音信号处理 分离目标 分离特征 分离效果 分离性能 平滑处理 输入语音 特征参数 研究对象 语音感知 噪声环境 可懂度 滤波 时频 组对 联合 | ||
【主权项】:
1.一种基于多分辨率的听觉感知语音特征参数提取方法,其特征在于:包括下列步骤:(1)、语音信号的预处理语音信号的预处理过程包括将输入信号、采样率调整为Fs、端点检测、对输入数据幅度进行规整、预加重,得到预处理后信号xx(n),n=1,2,...N,其中N为输入信号长度;(2)、对预处理后的信号xx(n),n=1,2,...N进行自适应压缩Gammachirp听觉滤波器组滤波,得到M通道的滤波信号xGc(i,j),i=1,...,M,j=1,...,N,其中M为自适应压缩Gammachirp听觉滤波器组的滤波器个数,N为输入信号长度;(3)、计算不同分辨率下的耳蜗谱根据设定的不同帧长,对M通道的滤波信号xGc(i,j),i=1,...M,j=1,...,N,计算每通道每帧信号的功率谱,提取不同分辨率下的对数耳蜗谱特征WCGc_ARMA;得到多分辨率的听觉感知特征参数![]()
其中,C(m)是WCGc第m帧的特征向量,
是多分辨率的听觉感知特征参数的WCGc_ARMA第m帧经过滤波后的特征向量,P为ARMA平滑滤波器的阶数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910297406.3/,转载请声明来源钻瓜专利网。