[发明专利]一种音频信号的处理方法、装置及设备无效
申请号: | 201310587304.8 | 申请日: | 2013-11-20 |
公开(公告)号: | CN103680517A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 徐德著;顾凤香;赵翔宇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G10L25/78;H04S1/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 黄厚刚 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 信号 处理 方法 装置 设备 | ||
1.一种音频信号的处理方法,其特征在于,所述方法包括:
将歌曲的单声道信号从时域转换成频域,得到第一频域信号,所述第一频域信号包括谐波类乐声成分、敲击类乐声成分和人声成分;
采用谐波类/敲击类音乐分离HPSS算法从所述第一频域信号中分离出第二频域信号,所述第二频域信号包括所述谐波类乐声成分和所述人声成分;
采用最相似相邻帧间的中值滤波NNMF算法从所述第二频域信号中提取出所述人声成分。
2.根据权利要求1所述的方法,其特征在于,所述采用谐波类/敲击类音乐分离HPSS算法从所述第一频域信号中分离出第二频域信号,包括:
对所述第一频域信号中每个频点取幅值,得到第一矩阵;
对所述第一矩阵中每一列进行中值滤波,得到第二矩阵;
对所述第一矩阵中每一行进行中值滤波,得到第三矩阵;
根据所述第二矩阵和所述第三矩阵,通过以下公式,从所述第一频域信号中分离出所述第二频域信号;
((P.*P)./((H.*H)+(P.*P))).*X
H表示所述第二矩阵,P表示所述第三矩阵,X表示所述第一矩阵,./表示点除运算,.*表示点乘运算。
3.根据权利要求1或2所述的方法,其特征在于,所述将歌曲的单声道信号从时域转换成频域,得到第一频域信号,包括:
采用快速傅里叶变换FFT将所述歌曲的单声道信号从时域转换成频域,得到所述第一频域信号;所述FFT的采样率为44.1KHz,帧长不小于8192点,帧移为所述帧长的一半。
4.根据权利要求1至3任一所述的方法,其特征在于,所述在采用最相似相邻帧间的中值滤波NNMF算法从所述第二频域信号中提取出所述人声成分之前,还包括:
采用快速傅里叶反变换将所述第二频域信号从频域转换成时域,再采用FFT进行时域到频域的转换,得到重复转换的第二频域信号;得到所述重复转换的第二频域信号所采用的FFT的采样率为44.1KHz,帧长不大于4096点,帧移为得到所述重复转换的第二频域信号采用的FFT的帧长的四分之一;
所述采用最相似相邻帧间的中值滤波NNMF算法从所述第二频域信号中提取出所述人声成分,包括:
采用NNMF算法从所述重复转换的第二频域信号中提取出所述人声成分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310587304.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大动态反射式可调光衰减器
- 下一篇:具有牺牲阴极层的反射制品