[发明专利]音高处理方法、装置、设备及存储介质有效
申请号: | 201911364543.0 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111081265B | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 劳振锋;肖纯智 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭新禹 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音高 处理 方法 装置 设备 存储 介质 | ||
本申请公开了一种音高处理方法、装置、设备及存储介质,属于音频处理领域。该方法包括:对目标音频片段的音高进行时域采样,得到多个时刻的初始音高;从多个时刻的初始音高中确定至少两个连续时刻的备选音高,其中,每个备选音高均处于音高范围内,且确定出的备选音高的个数小于初始音高的个数;对至少两个连续时刻的备选音高进行处理,得到多个时刻中每个时刻的修正音高。由于本申请可以对处于正常音高范围内的备选音高进行处理,得到与初始音高个数相同的多个时刻的修正音高,因此可以在确保最终合成的音频中的音高均处于正常音高范围的同时,确保每个目标音频片段对应的音高的完整性,从而确保最终合成的音频的效果。
技术领域
本公开涉及音频处理领域,特别涉及一种音高处理方法、装置、设备及存储介质。
背景技术
目前,终端在对用户录制的音频进行合成的过程中,在获取到用户录制的音频中每个字的多个音高后,为了避免最终合成的音频中出现杂音或者突变声,需要去除该多个音高中处于音高范围之外的音高,并基于去除后的音高进行音频合成。其中,音高由声音振动的频率决定。
但是,由于终端会将每个字的多个音高中不在音高范围内的部分音高去除,使得有的字的部分音高缺失,进而导致最终合成的音频效果较差。
发明内容
本公开实施例提供了一种音高处理方法、装置、设备及存储介质,可以解决相关技术中将每个字的多个音高中不在音高范围内的部分音高去除,导致最终合成的音频效果较差的问题。所述技术方案如下:
一方面,提供了一种音高处理方法,所述方法包括:
对目标音频片段的音高进行时域采样,得到多个时刻的初始音高;
从所述多个时刻的初始音高中确定至少两个连续时刻的备选音高,其中,每个所述备选音高均处于音高范围内,且确定出的所述备选音高的个数小于所述初始音高的个数;
对所述至少两个连续时刻的备选音高进行处理,得到所述多个时刻中每个时刻的修正音高。
可选的,所述从所述多个时刻的初始音高中确定至少两个连续时刻的备选音高,包括:
从所述多个时刻的初始音高中确定多个音高组,每个所述音高组包括至少两个连续时刻的初始音高,每个所述音高组包括的初始音高的个数小于所述初始音高的个数,且每个所述音高组中的每个所述初始音高均处于音高范围内;
将多个所述音高组中目标音高组包括的至少两个连续时刻的初始音高确定为备选音高,其中,所述目标音高组为多个所述音高组中,最后一个初始音高的时刻与所述多个时刻中最后一个时刻的差值最小的一个所述音高组。
可选的,所述对所述至少两个连续时刻的备选音高进行处理,得到所述多个时刻中每个时刻的修正音高,包括:
在所述至少两个连续时刻的备选音高中插入目标数量个差值音高;
基于所述目标数量个差值音高的插值位置,更新每个所述备选音高的时刻,以及每个所述差值音高的时刻,得到所述多个时刻中每个时刻的修正音高;
其中,所述目标数量等于所述初始音高的个数与所述备选音高的个数的差值,每个所述差值音高根据至少一个所述备选音高确定。
可选的,对于每个所述差值音高,所述差值音高等于所述差值音高插入位置处相邻的一个所述备选音高,或者,所述差值音高等于所述差值音高插入位置处相邻的两个所述备选音高的均值。
可选的,所述对所述至少两个连续时刻的备选音高进行处理,得到所述多个时刻中每个时刻的修正音高,包括:
依次对所述至少两个连续时刻的备选音高中,相邻第一数量个所述备选音高加权求和,得到第二数量个候选音高,其中,所述第二数量等于所述初始音高的个数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911364543.0/2.html,转载请声明来源钻瓜专利网。