[发明专利]声音信号的时延估计方法和装置在审
申请号: | 201510083890.1 | 申请日: | 2015-02-13 |
公开(公告)号: | CN104700842A | 公开(公告)日: | 2015-06-10 |
发明(设计)人: | 陈超 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/48 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 511442 广东省广州市番禺区南村镇万博二*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 信号 估计 方法 装置 | ||
本发明公开了一种声音信号的时延估计方法和装置,属于音频处理技术领域。所述方法包括:获取两路声音信号;根据两路声音信号的短时傅里叶变换对两路声音信号进行相干性匹配得到第一匹配结果,第一匹配结果包括两路声音信号的第一匹配位置和第一匹配度;根据两路声音信号的功率谱的谱间相关性对两路声音信号进行相干性匹配得到第二匹配结果,第二匹配结果包括两路声音信号的第二匹配位置和第二匹配度;根据第一匹配结果和第二匹配结果计算两路声音信号间的时延。解决了相关时延估计方法存在的准确度低的问题;从频域分布和功率谱的谱间相关性两个角度对声音信号进行匹配,综合两个匹配结果确定最终匹配结果,提高了匹配精度和时延估计准确度。
技术领域
本发明涉及音频处理技术领域,特别涉及一种声音信号的时延估计方法和装置。
背景技术
声音信号的时延估计算法在声音匹配、编解码对齐、声音测距等诸多领域都得到了广泛应用。
现有技术也提供了多种不同的时延估计方法,其中一种应用较为广泛的时延估计算法为基于相关分析的时延估计方法。该方法的基本思想为:利用两个声音信号在频域上的相似程度估算出这两个声音信号间的时延。
在实现本发明的过程中,发明人发现上述技术至少存在以下问题:上述基于相关分析的时延估计方法仅考虑了两个声音信号在频域上的相似程度,使得两个声音信号的匹配精度较低,导致最终计算得到的时延准确度较低。
发明内容
为了解决上述技术涉及的时延估计方法存在的准确度低的问题,本发明实施例提供了一种声音信号的时延估计方法和装置。所述技术方案如下:
第一方面,提供了一种声音信号的时延估计方法,所述方法包括:
获取两路声音信号;
根据所述两路声音信号的短时傅里叶变换对所述两路声音信号进行相干性匹配得到第一匹配结果,所述第一匹配结果包括所述两路声音信号的第一匹配位置和第一匹配度;
根据所述两路声音信号的功率谱的谱间相关性对所述两路声音信号进行相干性匹配得到第二匹配结果,所述第二匹配结果包括所述两路声音信号的第二匹配位置和第二匹配度;
根据所述第一匹配结果和所述第二匹配结果计算所述两路声音信号间的时延。
可选的,所述根据所述第一匹配结果和所述第二匹配结果计算所述两路声音信号间的时延,包括:
对于每一路声音信号,对所述第一匹配位置和所述第二匹配位置采用加权平均算法计算最终匹配位置,所述加权平均算法的权重是根据所述第一匹配度和所述第二匹配度确定的;
根据所述两路声音信号的所述最终匹配位置计算所述两路声音信号间的时延。
可选的,所述根据所述两路声音信号的短时傅里叶变换对所述两路声音信号进行相干性匹配得到第一匹配结果,包括:
对于每一路声音信号,按照下述公式对所述声音信号中的每一帧声音信号进行噪声跟踪,获取每一帧声音信号的噪声谱N(w,n):
其中,X(w,n)表示所述声音信号的短时傅里叶变换;α
按照下述公式对每一帧声音信号的短时傅里叶变换进行二值化处理得到二值谱Xb(w,n):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510083890.1/2.html,转载请声明来源钻瓜专利网。