[发明专利]一种基于SBC的低传输比特率高质量语音编解码方法有效

专利信息
申请号: 202010991900.2 申请日: 2020-09-21
公开(公告)号: CN112133317B 公开(公告)日: 2021-08-10
发明(设计)人: 左罡;胡晨光 申请(专利权)人: 易兆微电子(杭州)股份有限公司
主分类号: G10L19/02 分类号: G10L19/02;G10L19/022;G10L19/16;G10L21/0232
代理公司: 杭州中港知识产权代理有限公司 33353 代理人: 施建勇
地址: 310051 浙江省杭州市滨江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 sbc 传输 比特率 质量 语音 解码 方法
【权利要求书】:

1.一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,包括以下步骤:

S100,发射端实现8KHz采样率语音数据的SBC编码,生成比特流数据发送;

S200,接收端实现SBC解码,得到8KHz的脉冲编码调制语音数据;

S300,降噪模块对SBC解码得到的脉冲编码调制语音数据进行频域降噪;

所述步骤S100中,SBC编码,输入是脉冲编码调制数据,即采样后的时间序列,输出是二进制流,其具体步骤如下:

S101,脉冲编码调制数据输入至多相滤波器组,多相滤波器组把时间序列变换到频域,子频段的个数是4个或8个,取每一个子频段幅值的最大值作为这个子频段的尺度因子;

S102,比特分配和子带量化:每一个子频段有若干幅值需要编码,每个幅值需要用若干比特数来表示;同一个子频段中每个幅值的比特数相同,不同子频段幅值分配的比特数不同;为每个子频段分配幅值比特数的过程叫做比特分配;根据每个子频段的尺度因子及每个幅值需要的比特数,对每一个子频段进行编码的过程,得到每个子频段的量化结果,即子带量化;

S103,比特流打包:是将每个子频段编码后的结果组合起来,加上校验码、帧头信息,生成比特流数据发送;

步骤S102中,将比特分配设置为SNR,在8K采样率实现8:1的压缩率。

2.根据权利要求1所述的一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,所述步骤S200中,SBC解码过程是编码过程的逆过程,其输入是二进制流,输出是脉冲编码调制数据,其具体步骤如下:首先对比特流进行解包,得到一帧一帧的数据;每一帧中都包含子频段数、每个子频段的尺度因子、每个子频段幅值需要的比特数;根据这些信息及每个子频段编码之后的数据,重建子频段的编码前的数据;然后经过逆向的多相滤波器组,得到原始的脉冲编码调制数据;将所有子频段的脉冲编码调制数据合并,得到解码后的脉冲编码调制语音数据。

3.根据权利要求1所述的一种基于SBC的低传输比特率高质量语音编解码方法,其特征在于,所述步骤S300,包括以下步骤:

步骤S301,重叠加窗,时频转换:

降噪模块每次处理的时域点数为64点;每次保留前一帧的64个点的数据,组成128个点的语音帧,通过加窗防止重叠带来的突变,并保证重叠区部分窗口的平方和必须为1;根据需求设计的16bit位宽的128点窗函数的如下:

SqrtHanning=[0,399,798,1196,1594,1990,2386,2780,3172,

3562,3951,4337,4720,5101,5478,5853,6224,

6591,6954,7313,7668,8019,8364,8705,9040,

9370,9695,10013,10326,10633,10933,11227,11514,

11795,12068,12335,12594,12845,13089,13325,13553,

13773,13985,14189,14384,14571,14749,14918,15079,

15231,15373,15506,15631,15746,15851,15947,16034,

16111,16179,16237,16286,16325,16354,16373,16384,

16373,16354,16325,16286,16237,16179,16111,

16034,15947,15851,15746,15631,15506,15373,15231,

15079,14918,14749,14571,14384,14189,13985,13773,

13553,13325,13089,12845,12594,12335,12068,11795,

11514,11227,10933,10633,10326,10013,9695,9370,

9040,8705,8364,8019,7668,7313,6954,6591,

6224,5853,5478,5101,4720,4337,3951,3562,

3172,2780,2386,1990,1594,1196,798,399];

时域加窗操作表示为:

其中,y(n)是128点的一帧脉冲编码调制数据,加窗后进行128点FFT运算;

长度为N的数据序列y(n)的离散傅里叶变换Y(k)可表示为:

其中,,为旋转因子;

本步骤用按频率抽取的基4 FFT实现时域到频域的转换;

步骤S302,最小值跟踪估计噪声:

采用连续谱最小值跟踪法估计频域噪声分量;首先对各频点带噪语音功率谱进行平滑处理:

其中,P(k,n)为平滑后的第n帧、k频点的语音信号功率谱;Y(k,n) 为第n帧、k频点的幅值;α为平滑因子;平滑处理后对各频点带噪语音功率最小值进行非线性跟踪:

If

Else

End

本步骤中的非线性跟踪会连续对噪声功率进行估计,这里的就是估计的噪声功率谱密度;其中α取值为0.9, β取值为0.15,γ为0.8;

步骤S303,维纳滤波降噪:

维纳滤波的频域响应表示为:

滤波后的频域信号表示为:

步骤S304,去加窗,频时转换:

经过维纳滤波后,对频域信号进行去窗操作,使用加窗同样的窗函数,保证重叠区部分窗口的平方和为1;

去窗函数表示为:

由 X(k)通过离散傅里叶逆变换(IDFT)到 x(n)表示为:

通过上述步骤,实现了语音信号16Kbit/s的传输比特率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易兆微电子(杭州)股份有限公司,未经易兆微电子(杭州)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010991900.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top