[发明专利]音频编码方法、装置、计算机设备及介质有效
| 申请号: | 202110380547.9 | 申请日: | 2021-04-09 |
| 公开(公告)号: | CN112767956B | 公开(公告)日: | 2021-07-16 |
| 发明(设计)人: | 梁俊斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L19/002 | 分类号: | G10L19/002;G10L25/30;G10L25/69 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 编码 方法 装置 计算机 设备 介质 | ||
本申请是关于一种音频编码方法、装置、计算机设备及介质,属于音视频技术领域。该方法包括:获取原始音频中各个音频帧对应的音频特征参数;将所述音频特征参数输入编码码率预测模型中,得到所述编码码率预测模型输出的音频编码码率,其中,不同音频特征参数对应不同音频编码码率;基于所述音频编码码率对所述音频帧进行语音编码,并基于各帧音频帧对应的编码结果生成目标音频数据。通过分析原始音频中各个音频帧对应的音频特征参数,以实现基于音频特征参数动态调控音频编码码率的目的,可以为各个音频帧确定较适合的音频编码码率,从而提高整个音频的编码质量。
技术领域
本申请实施例涉及音视频技术领域,特别涉及一种音频编码方法、装置、计算机设备及介质。
背景技术
语音编码技术指的是:将采集到的原始无损音频信号,通过音频模型对时域和频域的冗余分析和压缩,从而降低语音传输带宽和存储空间,同时保持较好的音频质量。一般语音编码器的输入参数包括:采样率、通道数和编码码率等,其中,编码码率越大则编码码流占用带宽越多、编码文件占用的存储越多,语音编码质量越高。
相关技术中,一般通过实验经验值设置编码码率,比如,在实验室环境下使用PESQ的方法测量不同编码参数下对应的PESQ值,再根据PESQ值和语音质量目标要求进行匹配,进而确定所需要的语音编码码率,该语音编码码率被用于实际业务中,在语音编码压缩的整个过程中,编码码率通常是固定不变的。
显然,采用相关技术中的固定编码码率的语音编码方法,由于语音信号本身是时变信号,不同时刻、不同语音信号在语音编码器内部的压缩过程存在较大差异,会使得相同编码码率下对不同语音信号的编码质量差异较大,无法保证语音编码的质量。
发明内容
本申请实施例提供了一种音频编码方法、装置、计算机设备及介质,可以提高音频编码的质量,该技术方案包括如下方面。
一方面,提供了一种音频编码方法,所述方法包括:
获取第一样本音频中各个样本音频帧对应的样本音频特征参数;
将所述样本音频特征参数输入编码码率预测模型中,得到所述编码码率预测模型输出的样本编码码率;
基于所述样本编码码率对所述样本音频帧进行音频编码,并基于各帧样本音频帧对应的编码结果生成样本音频数据;
对所述样本音频数据进行音频解码,生成所述样本音频数据对应的第二样本音频;
基于所述第一样本音频和所述第二样本音频,训练所述编码码率预测模型。
另一方面,提供了一种音频编码方法,所述方法包括:
获取原始音频中各个音频帧对应的音频特征参数;
将所述音频特征参数输入编码码率预测模型中,得到所述编码码率预测模型输出的音频编码码率;
基于所述音频编码码率对所述音频帧进行语音编码,并基于各帧音频帧对应的编码结果生成目标音频数据。
另一方面,提供了一种音频编码装置,所述装置包括:
第一获取模块,用于获取第一样本音频中各个样本音频帧对应的样本音频特征参数;
第一处理模块,用于将所述样本音频特征参数输入编码码率预测模型中,得到所述编码码率预测模型输出的样本编码码率;
第一编码模块,用于基于所述样本编码码率对所述样本音频帧进行音频编码,并基于各帧样本音频帧对应的编码结果生成样本音频数据;
音频解码模块,用于对所述样本音频数据进行音频解码,生成所述样本音频数据对应的第二样本音频;
训练模块,用于基于所述第一样本音频和所述第二样本音频,训练所述编码码率预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110380547.9/2.html,转载请声明来源钻瓜专利网。





