[发明专利]一种基于SBC的低传输比特率高质量语音编解码方法有效
| 申请号: | 202010991900.2 | 申请日: | 2020-09-21 |
| 公开(公告)号: | CN112133317B | 公开(公告)日: | 2021-08-10 |
| 发明(设计)人: | 左罡;胡晨光 | 申请(专利权)人: | 易兆微电子(杭州)股份有限公司 |
| 主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/022;G10L19/16;G10L21/0232 |
| 代理公司: | 杭州中港知识产权代理有限公司 33353 | 代理人: | 施建勇 |
| 地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 sbc 传输 比特率 质量 语音 解码 方法 | ||
1.一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,包括以下步骤:
S100,发射端实现8KHz采样率语音数据的SBC编码,生成比特流数据发送;
S200,接收端实现SBC解码,得到8KHz的脉冲编码调制语音数据;
S300,降噪模块对SBC解码得到的脉冲编码调制语音数据进行频域降噪;
所述步骤S100中,SBC编码,输入是脉冲编码调制数据,即采样后的时间序列,输出是二进制流,其具体步骤如下:
S101,脉冲编码调制数据输入至多相滤波器组,多相滤波器组把时间序列变换到频域,子频段的个数是4个或8个,取每一个子频段幅值的最大值作为这个子频段的尺度因子;
S102,比特分配和子带量化:每一个子频段有若干幅值需要编码,每个幅值需要用若干比特数来表示;同一个子频段中每个幅值的比特数相同,不同子频段幅值分配的比特数不同;为每个子频段分配幅值比特数的过程叫做比特分配;根据每个子频段的尺度因子及每个幅值需要的比特数,对每一个子频段进行编码的过程,得到每个子频段的量化结果,即子带量化;
S103,比特流打包:是将每个子频段编码后的结果组合起来,加上校验码、帧头信息,生成比特流数据发送;
步骤S102中,将比特分配设置为SNR,在8K采样率实现8:1的压缩率。
2.根据权利要求1所述的一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,所述步骤S200中,SBC解码过程是编码过程的逆过程,其输入是二进制流,输出是脉冲编码调制数据,其具体步骤如下:首先对比特流进行解包,得到一帧一帧的数据;每一帧中都包含子频段数、每个子频段的尺度因子、每个子频段幅值需要的比特数;根据这些信息及每个子频段编码之后的数据,重建子频段的编码前的数据;然后经过逆向的多相滤波器组,得到原始的脉冲编码调制数据;将所有子频段的脉冲编码调制数据合并,得到解码后的脉冲编码调制语音数据。
3.根据权利要求1所述的一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,所述步骤S300,包括以下步骤:
步骤S301,重叠加窗,时频转换:
降噪模块每次处理的时域点数为64点;每次保留前一帧的64个点的数据,组成128个点的语音帧,通过加窗防止重叠带来的突变,并保证重叠区部分窗口的平方和必须为1;根据需求设计的16bit位宽的128点窗函数的如下:
SqrtHanning=[0,399,798,1196,1594,1990,2386,2780,3172,
3562,3951,4337,4720,5101,5478,5853,6224,
6591,6954,7313,7668,8019,8364,8705,9040,
9370,9695,10013,10326,10633,10933,11227,11514,
11795,12068,12335,12594,12845,13089,13325,13553,
13773,13985,14189,14384,14571,14749,14918,15079,
15231,15373,15506,15631,15746,15851,15947,16034,
16111,16179,16237,16286,16325,16354,16373,16384,
16373,16354,16325,16286,16237,16179,16111,
16034,15947,15851,15746,15631,15506,15373,15231,
15079,14918,14749,14571,14384,14189,13985,13773,
13553,13325,13089,12845,12594,12335,12068,11795,
11514,11227,10933,10633,10326,10013,9695,9370,
9040,8705,8364,8019,7668,7313,6954,6591,
6224,5853,5478,5101,4720,4337,3951,3562,
3172,2780,2386,1990,1594,1196,798,399];
时域加窗操作表示为:
其中,y(n)是128点的一帧脉冲编码调制数据,加窗后进行128点FFT运算;
长度为N的数据序列y(n)的离散傅里叶变换Y(k)可表示为:
其中,,为旋转因子;
本步骤用按频率抽取的基4 FFT实现时域到频域的转换;
步骤S302,最小值跟踪估计噪声:
采用连续谱最小值跟踪法估计频域噪声分量;首先对各频点带噪语音功率谱进行平滑处理:
其中,P(k,n)为平滑后的第n帧、k频点的语音信号功率谱;Y(k,n) 为第n帧、k频点的幅值;α为平滑因子;平滑处理后对各频点带噪语音功率最小值进行非线性跟踪:
If
Else
End
本步骤中的非线性跟踪会连续对噪声功率进行估计,这里的就是估计的噪声功率谱密度;其中α取值为0.9, β取值为0.15,γ为0.8;
步骤S303,维纳滤波降噪:
维纳滤波的频域响应表示为:
滤波后的频域信号表示为:
步骤S304,去加窗,频时转换:
经过维纳滤波后,对频域信号进行去窗操作,使用加窗同样的窗函数,保证重叠区部分窗口的平方和为1;
去窗函数表示为:
由 X(k)通过离散傅里叶逆变换(IDFT)到 x(n)表示为:
通过上述步骤,实现了语音信号16Kbit/s的传输比特率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易兆微电子(杭州)股份有限公司,未经易兆微电子(杭州)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010991900.2/1.html,转载请声明来源钻瓜专利网。





