[发明专利]一种音频编码方法、装置及设备在审
| 申请号: | 201911067455.4 | 申请日: | 2019-11-04 |
| 公开(公告)号: | CN110767243A | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 李强;王尧;叶东翔;朱勇 | 申请(专利权)人: | 重庆百瑞互联电子技术有限公司 |
| 主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/04;G10L19/24 |
| 代理公司: | 11664 北京华专卓海知识产权代理事务所(普通合伙) | 代理人: | 张继鑫 |
| 地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频信号 音频编码 音频编码装置 编解码器 蓝牙设备 瞬态信号 码率 通信技术领域 标准解码器 装置及设备 便携设备 动态编码 音频帧 运算量 音质 内存 兼容 占用 分类 预测 | ||
本发明公开了一种音频编码方法、装置及设备,属于通信技术领域。一种音频编码方法,根据音频信号的增益预测对音频信号进行分类,对含有瞬态信号的音频信号增加码率进行编码,对不含有瞬态信号的音频信号降低码率进行编码。一种音频编码装置的运行采用了此音频编码方法,该音频编码装置可进一步用于编解码器及含有此编解码器的蓝牙设备中。本发明对每一音频帧进行动态编码,这样可以在保持音质的前提下减少内存的占用,同时降低运算量,并兼容既有的标准解码器,从而降低在蓝牙设备上集成的难度,同时增加便携设备的使用时间。
技术领域
本发明涉及通信技术领域,特别是一种音频编码方法、装置及设备。
背景技术
目前主流的蓝牙音频编解码器有子带编码(SBC)、高级音频编码-低复杂度(AAC-LC)、aptX系列、LDAC。SBC的音质一般;aptX系列音质较好,但码率高,是高通公司独有的技术;LDAC音质较好,但码率高,是索尼公司独有的技术;AAC-LC音质较好且应用较为广泛,但与SBC相比,内存占用较大,且运算复杂度高,很多蓝牙设备都基于嵌入式平台,电池容量有限,处理器运算能力较差且内存有限。
基于感知音频编码技术的变换编解码器在处理瞬态信号时,瞬态信号在频域的量化噪声在时域的扩散会产生预回声(Pre-echo),对音质有较大的影响。主流AAC-LC编解码器(见附图1)中采用了块及滤波器组切换技术和时域噪声整形(TNS)技术可以有效抑制Pre-echo,但存在以下缺点:
一、需要进行块及滤波器组切换,判断是否需要切换可以基于感知熵或短时能量变化率,需要占用一定的计算资源且可能产生误判,另外,由于需要同时支持长窗、开始窗、短窗和结束窗,及其对应长度的改进离散余弦变换(MDCT)/快速傅里叶变换(FFT),代码量和数据量较大,且短窗时,每一帧数据需要计算并传输8个短窗的参数,更多的参数占用了有限的编码资源,降低了编码增益;
二、TNS模块的计算较为复杂,根据动态图象专家组(MPEG)4标准,每组MDCT的谱系数都需要一个TNS滤波器来滤波,当使用8个短窗时需要进行8次TNS的相关计算和滤波,另外,传输TNS数据也需要占用一定的带宽。
发明内容
本发明主要解决的技术问题是提供一种音频编码方法、装置及设备,在不影响音质的前提下减少内存的占用,同时降低运算量。
为了实现上述目的,本发明采用的第一个技术方案是:一种音频编码方法,其特征在于,
通过线性预测对音频信号计算预测增益;
根据所述预测增益的结果,将所述音频信号分为含瞬态信号的音频信号和不含瞬态信号的音频信号;
对所述含瞬态信号的音频信号在所述音频信号自身码率的基础上增加码率进行编码;以及
对所述不含瞬态信号的音频信号在所述音频信号自身码率的基础上降低码率进行编码。
优选的,还包括初始化设置预设码率,并对所述音频信号中的一音频帧进行如下处理:
所述一音频帧经过长滤波器组变换由时域信号变换为频域的谱系数;
根据所述谱系数的能量计算得到比例因子,根据所述比例因子的能量对所述谱系数加凯泽-贝塞尔窗;
计算所述谱系数的自相关系数,对所述自相关系数进行莱文森-德宾算法分析得到预测增益;
将所述预测增益的结果与第一门限比较,其中,
若所述预测增益的结果小于所述第一门限,判定所述一音频帧中没有所述瞬态信号,进而设定所述一音频帧码率为预设码率加第一码率;否则,
将所述预测增益的结果与第二门限比较,其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆百瑞互联电子技术有限公司,未经重庆百瑞互联电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911067455.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:声场的经分解表示的压缩
- 下一篇:语音增强方法





