[发明专利]音频生成的方法、装置、设备及存储介质在审
| 申请号: | 202010901040.9 | 申请日: | 2020-08-31 |
| 公开(公告)号: | CN112133319A | 公开(公告)日: | 2020-12-25 |
| 发明(设计)人: | 张斌 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
| 主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L21/003;G06F21/32;G06N3/04;G06N3/08 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 生成 方法 装置 设备 存储 介质 | ||
本申请公开了一种音频生成的方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:基于预设时长对目标音频进行切分,得到多个音频段;基于频域扩展模型的第一频域扩展模块,分别对每个音频段的幅度矩阵进行处理,得到每个音频段对应的第一中间结果矩阵;基于频域扩展模型的第二频域扩展模块,分别对每个音频段的幅度矩阵的转置矩阵进行处理,得到每个音频段对应的第二中间结果矩阵;对于每个音频段,基于所述音频段的第一中间结果矩阵与第二中间结果矩阵,确定包含高频数据的音频段;对每个包含高频数据的音频段进行组合,得到包含高频数据的目标音频。通过本申请可以增强用户听歌体验。
技术领域
本申请涉及计算机技术领域,特别涉及一种音频生成的方法、装置、设备及存储介质。
背景技术
音频数据库中需要存储的音频的数量非常庞大,需要的存储空间也非常庞大。为了满足这种存储需求,音频数据库的运营方经常会将音频中的高频数据去除,这样在对音频编码时可以提高压缩率降低数据量,从而可以降低存储空间的占用。这样处理后的音频,其中的声音还是能够正常被人耳听到的。
不过,对音频去除高频数据后,对音频的音质会有比较大的影响。
发明内容
本申请实施例提供了一种音频生成的方法、装置、设备及存储介质,能够解决用户听歌体验差的问题。所述技术方案如下:
一方面,提供了一种音频生成的方法,所述方法包括:
基于预设时长对目标音频进行切分,得到多个音频段,其中,所述预设时长是所述目标音频的帧间隔时长的N倍,N为大于1的整数;
基于频域扩展模型的第一频域扩展模块,分别对每个音频段的幅度矩阵进行处理,得到每个音频段对应的第一中间结果矩阵;
基于频域扩展模型的第二频域扩展模块,分别对每个音频段的幅度矩阵的转置矩阵进行处理,得到每个音频段对应的第二中间结果矩阵;
对于每个音频段,基于所述音频段的第一中间结果矩阵与第二中间结果矩阵,确定包含高频数据的音频段;
对每个包含高频数据的音频段进行组合,得到包含高频数据的目标音频。
可选的,所述基于预设时长对目标音频进行切分之前,还包括:
获取原始音频,对所述原始音频进行解码处理以及短时傅里叶变换处理,得到目标音频。
可选的,所述基于频域扩展模型的第一频域扩展模块,分别对每个音频段的幅度矩阵进行处理,得到每个音频段对应的第一中间结果矩阵,包括:
将每个音频段的幅度矩阵依次基于第一频域扩展模块的输入层、长短时记忆层、输出层进行处理,得到每个音频段对应的第一中间结果矩阵;
所述基于频域扩展模型的第二频域扩展模块,分别对每个音频段的幅度矩阵的转置矩阵进行处理,得到每个音频段对应的第二中间结果矩阵,包括:
将每个音频段的幅度矩阵的转置矩阵依次基于第二频域扩展模块的输入层、长短时记忆层、输出层进行处理,得到每个音频段对应的第二中间结果矩阵。
可选的,所述基于所述第一中间结果矩阵与所述第二中间结果矩阵,确定包含高频数据的音频段,包括:
对所述第二中间结果矩阵进行转置,得到所述第二中间结果矩阵的转置矩阵;
基于所述第一中间结果矩阵与所述第二中间结果矩阵的转置,确定包含高频数据的音频段的幅度矩阵;
基于所述音频段中每个时间点和每个频点对应的相位数据,以及所述包含高频数据的音频段的幅度矩阵中每个时间点和每个频点对应的幅度数据,生成包含高频数据的音频段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010901040.9/2.html,转载请声明来源钻瓜专利网。





