[发明专利]一种立体声音频的带宽扩展方法与装置有效
申请号: | 201710203054.1 | 申请日: | 2017-03-30 |
公开(公告)号: | CN106960672B | 公开(公告)日: | 2020-08-21 |
发明(设计)人: | 高昕;颜永红;邹潇湘;白海钏;舒敏;云晓春;王锟;张震;计哲;董琳;金暐;王中华;李海灵;李佳 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;中国科学院声学研究所 |
主分类号: | G10L21/0388 | 分类号: | G10L21/0388;H04S7/00 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 于金平 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 立体声 音频 带宽 扩展 方法 装置 | ||
1.一种立体声音频的带宽扩展方法,其特征在于,包括:
将立体声信号分解为直达声和扩散声;
按照预设的频带扩展方法对所述扩散声进行带宽扩展;
将所述直达声分离成多个不同方位的点声源,对多个点声源分别进行带宽扩展,得到带宽扩展后的多个点声源;
将所述带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合,得到带宽扩展后的直达声,根据所述带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。
2.如权利要求1所述的立体声音频的带宽扩展方法,其特征在于,所述将立体声信号分解为直达声和扩散声,包括:
将所述立体声信号分解为左声道和右声道;
分别将分帧处理后的左声道和右声道进行时频变换,得到立体声信号的左声道短时频谱成分和右声道短时频谱成分;
分别根据所述左声道短时频谱成分和右声道短时频谱成分,得到左右声道信号能量谱之间的和Psum、左右声道信号能量谱之间的差Pdiff、左右声道信号能量谱之间的互相关Pcc;
利用所述Psum、Pdiff及Pcc,通过最小二乘法得到直达声矩阵;
利用所述直达声矩阵从所述立体声信号中分离出直达声;
在所述立体声信号中剔除所述直达声,得到扩散声。
3.如权利要求1所述的立体声音频的带宽扩展方法,其特征在于,
所述将所述直达声分离成多个不同方位的点声源,包括:
计算每一个时频点上直达声的方向信息,对全部时频点的方向信息进行聚类,得到方向信息的聚类中心,所述聚类中心分别对应各个点声源的方向信息;
根据某一时频点上直达声的方向信息和所述方向信息的聚类中心,得到掩蔽矩阵;
利用所述掩蔽矩阵对直达声进行分离,得到多个不同方位的点声源。
4.如权利要求1所述的立体声音频的带宽扩展方法,其特征在于,
所述对多个点声源分别进行带宽扩展,包括:
将多个点声源分别输入到预设的状态空间模型中拟合窄带信号的短时频谱和宽带信号的短时频谱之间的映射关系,并根据预设的误差准则对宽带信号短时频谱高频成分的频谱包络进行估计,结合低频频谱包络和采用适当频谱修补方法扩展后的频谱细节,得到带宽扩展后的多个点声源。
5.如权利要求4所述的立体声音频的带宽扩展方法,其特征在于,
所述状态空间模型中拟合窄带信号的短时频谱和宽带信号的短时频谱之间的映射关系,并根据预设的误差准则对高频成分的频谱包络进行估计,包括:
利用前一时刻隐藏状态矢量和前一时刻窄带信号的短时频谱,得到所述状态空间模型中的隐藏状态矢量;
利用所述状态空间模型中的隐藏状态矢量和当前时刻窄带信号的短时频谱,得到宽带信号的短时频谱。
6.一种立体声音频的带宽扩展装置,其特征在于,包括:分解模块、扩散声扩展模块、直达声分离与扩展模块、重构模块;
所述分解模块,用于将立体声信号分解为直达声和扩散声;
所述扩散声扩展模块,用于按照预设的频带扩展方法对所述扩散声进行带宽扩展;
所述直达声分离与扩展模块,用于将所述直达声分离成多个不同方位的点声源,对多个点声源分别进行带宽扩展,得到带宽扩展后的多个点声源;
所述重构模块,用于将所述带宽扩展后的多个点声源按照预先估计的方位信息进行重新混合,得到带宽扩展后的直达声,根据所述带宽扩展后的直达声结合带宽扩展后的扩散声重建出宽带立体声音频信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;中国科学院声学研究所,未经国家计算机网络与信息安全管理中心;中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710203054.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种录音方法和电子设备
- 下一篇:一种语音掩蔽方法和设备