[发明专利]基于人工智能的音频编解码在审
| 申请号: | 202080061632.2 | 申请日: | 2020-06-29 |
| 公开(公告)号: | CN114341977A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | Z.I.斯科迪利斯;V.拉詹德兰;G.K.索蒂尔;D.J.辛德 | 申请(专利权)人: | 高通股份有限公司 |
| 主分类号: | G10L19/12 | 分类号: | G10L19/12;G10L19/13;G10L19/09;G10L19/06;G10L25/30 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 安之斐 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人工智能 音频 解码 | ||
1.一种用于重构一个或多个音频信号的装置,包括:
存储器,被配置为存储音频数据;以及
一个或多个处理器,在电路中实施并耦合到所述存储器,所述一个或多个处理器被配置为:
使用神经网络,基于所述神经网络的一个或多个输入,生成音频信号的至少一个样本的残差信号,所述残差信号被配置为激励长期预测滤波器和短期预测滤波器中的至少一个;以及
使用所述长期预测滤波器和所述短期预测滤波器中的至少一个来确定重构音频信号的至少一个样本,所述重构音频信号的所述至少一个样本是基于使用所述神经网络为所述音频信号的所述至少一个样本生成的所述残差信号来确定的。
2.根据权利要求1所述的装置,其中所述长期预测滤波器是长期线性预测(LTP)滤波器。
3.根据权利要求2所述的装置,其中所述残差信号包括被配置为激励所述LTP滤波器的长期线性预测(LTP)残差。
4.根据权利要求3所述的装置,其中所述一个或多个处理器被配置为:
使用所述LTP滤波器确定所述音频信号的所述至少一个样本的线性预测(LP)残差,所述音频信号的所述至少一个样本的所述LP残差是基于使用所述神经网络为所述音频信号的所述至少一个样本生成的所述LTP残差和使用增益和所述音频信号的至少一个先前样本的LP残差确定的所述音频信号的所述至少一个样本的LTP预测来确定的。
5.根据权利要求4所述的装置,其中所述增益被应用于所述音频信号的所述至少一个先前样本的所述LP残差。
6.根据权利要求4所述的装置,其中所述短期预测滤波器是短期线性预测(LP)滤波器。
7.根据权利要求6所述的装置,其中所述一个或多个处理器被配置为:
使用所述短期LP滤波器确定所述重构音频信号的所述至少一个样本,所述重构音频信号的所述至少一个样本是基于为所述音频信号的所述至少一个样本确定的LP预测和所述LP残差来确定的。
8.根据权利要求7所述的装置,其中所述神经网络的一个或多个输入包括针对所述音频信号的所述至少一个样本的所述LTP预测、针对所述音频信号的所述至少一个样本的所述LP预测、由所述神经网络为所述音频信号的所述至少一个先前样本确定的先前LTP残差和所述重构音频信号的至少一个先前样本中的至少一个。
9.根据权利要求7所述的装置,其中将使用所述神经网络为所述音频信号的所述至少一个样本生成的所述LTP残差与所述音频信号的所述至少一个样本的所述LTP预测组合以生成所述音频信号的所述至少一个样本的所述LP残差。
10.根据权利要求7所述的装置,其中为所述音频信号的所述至少一个样本确定的所述LP残差与所述音频信号的所述至少一个样本的所述LP预测组合以确定所述重构音频信号的所述至少一个样本。
11.根据权利要求1所述的装置,其中所述短期预测滤波器是短期线性预测(LP)滤波器。
12.根据权利要求11所述的装置,其中所述残差信号包括被配置为激励所述短期LP滤波器的线性预测(LP)残差。
13.根据权利要求12所述的装置,其中所述一个或多个处理器被配置为:
使用所述短期LP滤波器确定所述音频信号的所述至少一个样本的长期线性预测(LTP)残差,所述至少一个样本的所述LTP残差是基于所述音频信号的所述至少一个样本的LP预测和使用所述神经网络生成的所述LP残差来确定的。
14.根据权利要求13所述的装置,其中所述长期预测滤波器是长期线性预测(LTP)滤波器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080061632.2/1.html,转载请声明来源钻瓜专利网。





