[发明专利]一种音频处理方法及装置、存储介质在审
申请号: | 202111566841.5 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114286275A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 刘雪松 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | H04S7/00 | 分类号: | H04S7/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张静;王黎延 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 处理 方法 装置 存储 介质 | ||
本申请实施例提供了一种音频处理方法及装置、存储介质,该方法包括:确定音频文件对应的音频场景的场景类型;识别音频文件中的第一发声对象和第二发声对象;分别确定第一发声对象和第二发声对象在音频场景中的第一位置参数和第二位置参数;基于第一发声对象和第二发声对象各自的对象类型对音频文件进行声音分离,得到关联于第一发声对象的第一音轨数据、关联于第二发声对象的第二音轨数据以及关联于音频场景的背景音轨数据;基于场景类型和第一位置参数、第二位置参数对第一音轨数据、第二音轨数据以及背景音轨数据进行混音处理,得到待播放音频数据。
技术领域
本申请涉及音频领域,尤其涉及一种音频处理方法及装置、存储介质。
背景技术
近年来,空间音效技术在电子产品中得到了广泛的应用。空间音效技术可以在用户欣赏电影或音乐时营造出真实的临场感和空间感。目前主要使用的空间音效技术是基于头相关传递函数(Head Related Transfer Function,HRTF)的空间渲染技术,而基于HRTF的空间渲染技术依赖多声道或基于目标的声音格式才能产生真实的空间效果。对于双声道立体声音频内容,由于其经过混音处理后,无法保留每个音源的准确空间位置,需要通过音效增强或虚拟环绕声技术来模拟空间音效,会导致模拟出的临场感和空间感的真实性低的问题。
发明内容
本申请实施例提供一种音频处理方法及装置、存储介质,能够针对立体声音频内容,提高模拟出的临场感和空间感的真实性。
本申请的技术方案是这样实现的:
第一方面,本申请实施例提出一种音频处理方法,所述方法包括:
确定音频文件对应的音频场景的场景类型;
识别所述音频文件中的第一发声对象和第二发声对象;
分别确定所述第一发声对象和所述第二发声对象在所述音频场景中的第一位置参数和第二位置参数;
基于所述第一发声对象和所述第二发声对象各自的对象类型对所述音频文件进行声音分离,得到关联于所述第一发声对象的第一音轨数据、关联于所述第二发声对象的第二音轨数据以及关联于所述音频场景的背景音轨数据;
基于所述场景类型和所述第一位置参数、所述第二位置参数对所述第一音轨数据、所述第二音轨数据以及所述背景音轨数据进行混音处理,得到待播放音频数据。
第二方面,本申请实施例提出一种音频处理装置,所述装置包括:
对象识别单元,配置成识别音频文件中的第一发声对象和第二发声对象,以及分别确定所述第一发声对象和所述第二发声对象在音频场景中的第一位置参数和第二位置参数;
声音分离单元,配置成基于所述第一发声对象和所述第二发声对象各自的对象类型对所述音频文件进行声音分离,得到关联于所述第一发声对象的第一音轨数据、关联于所述第二发声对象的第二音轨数据以及关联于所述音频场景的背景音轨数据;
音轨处理单元,配置成基于所述场景类型和所述第一位置参数、所述第二位置参数对所述第一音轨数据、所述第二音轨数据以及所述背景音轨数据进行混音处理,得到待播放音频数据。
第三方面,本申请实施例提出一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的音频处理方法。
第四方面,本申请实施例提出一种应用处理器,用于对音频文件进行处理,所述应用处理器配置成:
确定所述音频文件对应的音频场景的场景类型;
识别所述音频文件中的第一发声对象和第二发声对象;
分别确定所述第一发声对象和所述第二发声对象在所述音频场景中的第一位置参数和第二位置参数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111566841.5/2.html,转载请声明来源钻瓜专利网。