[发明专利]反馈延迟网络音色优化的方法有效
申请号: | 201610374440.2 | 申请日: | 2016-05-31 |
公开(公告)号: | CN105916095B | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 杨维国;侯欢;周寅腾 | 申请(专利权)人: | 音曼(北京)科技有限公司 |
主分类号: | H04S1/00 | 分类号: | H04S1/00;H04S7/00 |
代理公司: | 天津市三利专利商标代理有限公司12107 | 代理人: | 韩新城 |
地址: | 100029 北京市朝阳区日坛北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 反馈 延迟 网络 音色 优化 方法 | ||
技术领域
本发明属于音频信号处理技术领域,具体涉及一种反馈延迟网络音色优化的方法。
背景技术
基于耳机及扬声器的音频信号的渲染经常会用到对于房间混响模拟。其中基于耳机的渲染包括与扬声器同样的方法和耳机独有的耳机双声道虚拟环绕声的方法。其应用场景如在安静的室内,通过新品信号处理算法,可以通过扬声器播放进行混响处理的音频信号,已达到模拟剧场、山洞的效果。进行此类音频信号处理可以使用将原信号与期望房间的混响进行卷积的方法。但在实际应用中,由于房间混响(即冲击响应)通常为阶数极高的FIR滤波器,应用时导致算法复杂度升高,效率降低。
另外在很多应用中,对于房间的混响需要进行微调或实时变换。冲击响应卷积的方法不能满足此类需求。因此,在实际应用中常使用反馈延迟网络(Feedback Delay Network,FDN)的方法进行房间混响的模拟。含有3条延迟线的反馈延迟网络如图1所示。
其中,输入信号为i,输出信号为o,M为延迟线的延迟系数或参数(即延迟的采样点数),Z为z变换符号,g为增益项,q为反馈矩阵元素。图2中的系统可以在时域或频域中使用。当在时域时,g、q为一实数。当在频域时,g、q为一维向量,维度表示频点。
在反馈延迟网络第一次有信号输入时,输入信号i(n)在进入反馈延迟网络时将分别输入至若干个延迟线中。如在图2中,延迟线的数量为3条。在经过延迟线时输入信号将被延迟输出j个采样点。在延迟线输出信号上将加入相应的增益值gj,其取值将在后面详述。最后所有延迟线上的输出信号将被叠加输出,即o(n)。延迟线输出信号在被叠加之前,会被同时输入到反馈系统中。在延迟线的输出信号被反馈至输入端之前,延迟线的输出信号会经过反馈矩阵的混合处理。反馈矩阵的作用为将输入信号进行混合,使得最终输出结果的随机性增加。在房间混响模拟的应用中,这种处理将会使输出信号更具随机性、更像真实房间的混响。混合矩阵的输出信号将被反馈至下一帧的输入端,与下一帧的输入进行叠加。在叠加后的信号x(n)可以全面表征整个反馈延迟系统的性质:
图2系统中的x所在点的信号可用公式1表示:
其中,x、q已知。g可由期望的房间反射时间(T60)求得(dB域):
其中fs为音频信号的采样率。
到这里,只有M的值还未确定。M的选择既影响反馈延迟网络内的增益,又影响延迟时间。实际上,M的选择最终会影响反馈延迟网络在还原房间声学特性的自然度-即人工生成的房间混响和真实房间的混响间在音色等方面的差别。M选择不良会导致最终结果音色失真,虽然目前有人提出M的一些选择条件,但根据该条件选择M后,在实际应用中,发现即使满足上述要求,最终输出的音频信号仍然会有一定的音色失真,严重影响听感。
发明内容
本发明的目的在于解决上述的技术问题而提供一种反馈延迟网络音色优化的方法,旨在利用优化算法得到使得输出信号音色高度自然的延迟线参数。
为实现上述目的,本发明采用如下技术方案:
一种反馈延迟网络音色优化的方法,在选择反馈延迟网络延迟线的延迟系数时通过以下步骤进行;
根据预设选择条件选择确定多个延迟系数组合;
计算多个所述延迟系数组合所分别对应的多个频谱平整度值;
比较多个所述频谱平整度值,将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合。
所述根据预设选择条件选择确定多个延迟系数组合满足下列条件:
∑iMi≥0.15fs·T60且Max(Mi)≤2.5·Min(Mi),
其中,1≤i≤I,I为延迟线数量,M表示延迟线系数,I条延迟线互质,T60为房间混响,fs为音频信号的采样率。
所述频谱平整度值的计算公式如下:
其中,Flatness为频谱平整度,取值范围为(0,1),fs为音频信号的采样率,x(k)为反馈延迟网络的输出频率响应的幅值,k代表频率。
或者,所述频谱平整度值的计算采用如下公式:
其中,Flatness为频谱平整度,取值范围为(0,1),w=2πk,Gi(w)为延迟线的频率响应的幅值,fs为音频信号的采样率,k代表频率,1≤i≤I,I为延迟线数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于音曼(北京)科技有限公司,未经音曼(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610374440.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息终端装置、信息取得装置和信息援助方法
- 下一篇:一种表面传声器校准装置