[发明专利]音频合成方法及装置在审
| 申请号: | 201911284619.9 | 申请日: | 2019-12-13 |
| 公开(公告)号: | CN111048063A | 公开(公告)日: | 2020-04-21 |
| 发明(设计)人: | 崔晶晶;张政 | 申请(专利权)人: | 集奥聚合(北京)人工智能科技有限公司 |
| 主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/033 |
| 代理公司: | 北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617 | 代理人: | 李绩 |
| 地址: | 100024 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 合成 方法 装置 | ||
本申请实施例提供一种音频合成方法及装置,方法包括:对预录音材料进行响度预处理和均衡参数预处理;将经过处理后的预录音材料与合成音进行音频拼接,得到目标音频文件;本申请能够有效克服因真人录音与电子合成音音色差别造成的拼接不流畅、过度突兀的问题,进而提高用户的听觉体验感观。
技术领域
本申请涉及音频处理领域,具体涉及一种音频合成方法及装置。
背景技术
在有变量或者用户隐私内容等不便于真人录音时,必须使用合成音进行插入以保证整句话的完整表达。真人录音与电子合成音在音色上有显著区别,如果不进行处理,会严重影响体验感观。
发明内容
针对现有技术中的问题,本申请提供一种音频合成方法及装置,能够有效克服因真人录音与电子合成音音色差别造成的拼接不流畅、过度突兀的问题,进而提高用户的听觉体验感观。
为了解决上述问题中的至少一个,本申请提供以下技术方案:
第一方面,本申请提供一种音频合成方法,包括:
对预录音材料进行响度预处理和均衡参数预处理;
将经过处理后的预录音材料与合成音进行音频拼接,得到目标音频文件。
进一步地,所述对预录音材料进行响度预处理,包括:
根据ERB谱计算Moore响度算法,对所述合成音进行分析,得到合成音Moore响度数值;
根据ERB谱计算Moore响度算法,对所述预录音材料进行分析,得到预录音Moore响度数值;
根据所述合成音Moore响度数值,对所述预录音Moore响度数值进行数值调整。
进一步地,所述对预录音材料进行均衡参数预处理,包括:
根据EQ均衡器算法,对所述合成音进行分析,得到合成音均衡频谱特征,并对此频谱设定专用颜色标示;
根据EQ均衡器算法,对所述预录音材料进行分析,得到预录音均衡频谱特征,并对此频谱设定专用颜色标示(与语音合成音颜色不同);
根据所述合成音均衡频谱特征中的均衡参数,对所述预录音材料的预录音均衡频谱特征中的均衡参数进行调整。
进一步地,所述将经过处理后的预录音材料与合成音进行音频拼接,包括:
根据预设语音话术流程,依次导入对应的所述预录音材料。
根据预设话术模板调用所述预录音材料并播放。
第二方面,本申请提供一种音频合成装置,包括:
预录音材料预处理模块,用于对预录音材料进行响度预处理和均衡参数预处理;
音频拼接模块,用于将经过处理后的预录音材料与合成音进行音频拼接,得到目标音频文件。
进一步地,所述预录音材料预处理模块包括:
第一响度分析单元,用于根据ERB谱计算Moore响度算法,对所述合成音进行分析,得到合成音Moore响度数值;
第二响度分析单元,用于根据ERB谱计算Moore响度算法,对所述预录音材料进行分析,得到预录音Moore响度数值;
响度修正单元,用于根据所述合成音Moore响度数值,对所述预录音Moore响度数值进行数值调整。
进一步地,所述预录音材料预处理模块还包括:
第一均衡参数分析单元,用于根据EQ均衡器算法,对所述合成音进行分析,得到合成音均衡频谱特征,并对此频谱设定专用颜色标示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于集奥聚合(北京)人工智能科技有限公司,未经集奥聚合(北京)人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911284619.9/2.html,转载请声明来源钻瓜专利网。





