[发明专利]一种音频信号的处理方法、装置及设备无效
申请号: | 201310587304.8 | 申请日: | 2013-11-20 |
公开(公告)号: | CN103680517A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 徐德著;顾凤香;赵翔宇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L25/78;H04S1/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 黄厚刚 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 信号 处理 方法 装置 设备 | ||
技术领域
本发明涉及音频处理领域,特别涉及一种音频信号的处理方法、装置及设备。
背景技术
单声道或双声道歌曲的每个声道信号一般包括人声和伴奏两种音频信号。如果用户想提取出歌曲中的人声或伴奏,可以采用人声或伴奏分离技术将人声或伴奏从歌曲中提取出来。
以人声分离为例,介绍一下现有分离方式,其包括以下步骤:第一步,分别将歌曲的左右声道信号由时域转换为频域;第二步,计算左右声道信号的相应频点对的归一化互相关值;第三步,对左右声道信号相应频点对的均值信号加权人声增益,人声增益与当前频点对的归一化互相关值成正比例取值;第四步,将加权人声增益后的左声道信号和右声道信号的均值信号由频域转换为时域提取出人声。
现有分离方式依据歌曲的左右声道信号的相关性给予音乐成分不同增益,不同频点对的增益不同,且不同频点对的增益取值相互独立,没有一定的相关性,取不同增益时会改变音色特征,导致人声失真;这样,提取出的人声效果比较差,无法满足高品质人声的提取要求。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种音频信号的处理方法、装置及设备。所述技术方案如下:
第一方面,本发明实施例提供了一种音频信号的处理方法,所述方法包括:
将歌曲的单声道信号从时域转换成频域,得到第一频域信号,所述第一频域信号包括谐波类乐声成分、敲击类乐声成分和人声成分;
采用谐波类/敲击类音乐分离HPSS算法从所述第一频域信号中分离出第二频域信号,所述第二频域信号包括所述敲击类乐声成分和所述人声成分;
采用最相似相邻帧间的中值滤波NNMF算法从所述第二频域信号中提取出所述人声成分。
在第一方面的第一种实现方式中,所述采用谐波类/敲击类音乐分离HPSS算法从所述第一频域信号中分离出第二频域信号,包括:
对所述第一频域信号中每个频点取幅值,得到第一矩阵;
对所述第一矩阵中每一列进行中值滤波,得到第二矩阵,并对所述第一矩阵中每一行进行中值滤波,得到第三矩阵;
根据所述第二矩阵和所述第三矩阵,通过以下公式,从所述第一频域信号中分离出所述第二频域信号;
((P.*P)./((H.*H)+(P.*P))).*X
H表示所述第二矩阵,P表示所述第三矩阵,X表示所述第一矩阵,./表示点除运算,.*表示点乘运算。
结合第一方面或第一方面的第一种实现方式,在第二种实现方式中,所述将歌曲的单声道信号从时域转换成频域,得到第一频域信号,包括:
采用快速傅里叶变换FFT将所述歌曲的单声道信号从时域转换成频域,得到所述第一频域信号;所述FFT的采样率为44.1KHz,帧长不小于8192点,帧移为所述帧长的一半。
结合第一方面、第一方面的第一种实现方式或第二种实现方式,在第三种实现方式中,所述采用最相似相邻帧间的中值滤波NNMF算法从所述第二频域信号中提取出所述人声成分之前,还包括:
采用快速傅里叶反变换将所述第二频域信号从频域转换成时域,再采用FFT进行时域到频域的转换,得到重复转换的所述第二频域信号;得到所述重复转换的第二频域信号所采用的FFT的采样率为44.1KHz,帧长不大于4096点,帧移为得到所述重复转换的第二频域信号采用的FFT的帧长的四分之一;
所述采用最相似相邻帧间的中值滤波NNMF算法从所述第二频域信号中提取出所述人声成分,包括:
采用NNMF算法从所述重复转换的第二频域信号中提取出所述人声成分。
结合第一方面的第三种实现方式,在第四种实现方式中,所述采用NNMF算法从所述重复转换的第二频域信号中提取出所述人声成分,包括:
对所述重复转换的第二频域信号中每个频点取幅值;
遍历所述重复转换的第二频域信号中每一帧信号,计算每一帧信号分别与所述重复转换的第二频域信号中除所述每一帧信号外的其他帧信号之间的相似度;
根据所述相似度,获取所述重复转换的第二频域信号的频域谱估计;
通过以下公式,计算所述重复转换的第二频域信号与所述重复转换的第二频域信号的频域谱估计之间相应频点对的指数归一化互相关值的差值,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310587304.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大动态反射式可调光衰减器
- 下一篇:具有牺牲阴极层的反射制品