[发明专利]一种音频处理方法及装置、存储介质在审

申请号：	202111566841.5	申请日：	2021-12-20
公开（公告）号：	CN114286275A	公开（公告）日：	2022-04-05
发明（设计）人：	刘雪松	申请（专利权）人：	OPPO广东移动通信有限公司
主分类号：	H04S7/00	分类号：	H04S7/00
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	张静;王黎延
地址：	523860 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频处理方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种音频处理方法及装置、存储介质，该方法包括：确定音频文件对应的音频场景的场景类型；识别音频文件中的第一发声对象和第二发声对象；分别确定第一发声对象和第二发声对象在音频场景中的第一位置参数和第二位置参数；基于第一发声对象和第二发声对象各自的对象类型对音频文件进行声音分离，得到关联于第一发声对象的第一音轨数据、关联于第二发声对象的第二音轨数据以及关联于音频场景的背景音轨数据；基于场景类型和第一位置参数、第二位置参数对第一音轨数据、第二音轨数据以及背景音轨数据进行混音处理，得到待播放音频数据。

技术领域

本申请涉及音频领域，尤其涉及一种音频处理方法及装置、存储介质。

背景技术

近年来，空间音效技术在电子产品中得到了广泛的应用。空间音效技术可以在用户欣赏电影或音乐时营造出真实的临场感和空间感。目前主要使用的空间音效技术是基于头相关传递函数(Head Related Transfer Function，HRTF)的空间渲染技术，而基于HRTF的空间渲染技术依赖多声道或基于目标的声音格式才能产生真实的空间效果。对于双声道立体声音频内容，由于其经过混音处理后，无法保留每个音源的准确空间位置，需要通过音效增强或虚拟环绕声技术来模拟空间音效，会导致模拟出的临场感和空间感的真实性低的问题。

发明内容

本申请实施例提供一种音频处理方法及装置、存储介质，能够针对立体声音频内容，提高模拟出的临场感和空间感的真实性。

本申请的技术方案是这样实现的：

第一方面，本申请实施例提出一种音频处理方法，所述方法包括：

确定音频文件对应的音频场景的场景类型；

识别所述音频文件中的第一发声对象和第二发声对象；

分别确定所述第一发声对象和所述第二发声对象在所述音频场景中的第一位置参数和第二位置参数；

基于所述第一发声对象和所述第二发声对象各自的对象类型对所述音频文件进行声音分离，得到关联于所述第一发声对象的第一音轨数据、关联于所述第二发声对象的第二音轨数据以及关联于所述音频场景的背景音轨数据；

基于所述场景类型和所述第一位置参数、所述第二位置参数对所述第一音轨数据、所述第二音轨数据以及所述背景音轨数据进行混音处理，得到待播放音频数据。

第二方面，本申请实施例提出一种音频处理装置，所述装置包括：

对象识别单元，配置成识别音频文件中的第一发声对象和第二发声对象，以及分别确定所述第一发声对象和所述第二发声对象在音频场景中的第一位置参数和第二位置参数；

声音分离单元，配置成基于所述第一发声对象和所述第二发声对象各自的对象类型对所述音频文件进行声音分离，得到关联于所述第一发声对象的第一音轨数据、关联于所述第二发声对象的第二音轨数据以及关联于所述音频场景的背景音轨数据；