[发明专利]检测音频的节奏点的方法、装置、设备及可读存储介质有效
申请号: | 201911354005.3 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111048111B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 劳振锋;陈传艺 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/21;G10L25/18 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭新禹 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 音频 节奏 方法 装置 设备 可读 存储 介质 | ||
本申请公开了一种检测音频的节奏点的方法、装置、设备及可读存储介质,属于音频处理技术领域。该方法包括:获取待检测音频;对所述待检测音频进行音轨分离,得到鼓声音频;基于所述鼓声音频和节奏点预测神经网络模型,确定所述待检测音频的多种类型的节奏点。采用本申请提供的方法,可以有效解决相关技术中检测音频的节奏点的准确率较低的技术问题。
技术领域
本申请涉及音频处理技术领域,具体涉及一种检测音频的节奏点的方法、装置、设备及可读存储介质。
背景技术
架子鼓是一种常用的乐器,在大部分歌曲音频中都存在架子鼓发出的鼓声。在歌曲音频中某些出现鼓声的时间点可以称为鼓点(鼓点也可以称为节奏点)。根据歌曲音频在鼓点的鼓声的不同,鼓点可以分为低频鼓点、中频鼓点和高频鼓点,其中,歌曲音频在低频鼓点存在击打底鼓发出的声音,在中频鼓点存在击打军鼓或嗵鼓发出的声音,在高频鼓点存在击打镲发出的声音。低频鼓点、中频鼓点和高频鼓点还可以称为低频节奏点、中频节奏点和高频节奏点。在歌曲音频中提取出各种类型的节奏点之后,可以利用节奏点做一些有趣的应用,例如,在以歌曲音频为背景音乐的视频中,可以在歌曲音频的中频节奏点,进行视频场景的切换,以增强视频的节奏感。
相关技术中检测歌曲音频的节奏点时,通过检测歌曲音频在各个时间点的能量来确定歌曲音频的各个节奏点,例如,如果歌曲音频在某一时间点的能量满足中频能量特征,则确定该时间点为中频节奏点。
在通过相关技术中的方法确定歌曲音频的节奏点时,很容易受到歌曲音频中除鼓声之外的其余声音(如人声和其它乐器声)的干扰,这使得检测出的节奏点的准确率较低。
发明内容
本申请实施例提供了一种检测音频的节奏点的方法、装置、设备及计算机可读存储介质,可以解决相关技术中存在的技术问题。所述检测音频的节奏点的方法、装置、设备及计算机可读存储介质的技术方案如下:
第一方面,提供了一种检测音频的节奏点的方法,所述方法包括:
获取待检测音频;
对所述待检测音频进行音轨分离,得到鼓声音频;
基于所述鼓声音频和节奏点预测神经网络模型,确定所述待检测音频的多种类型的节奏点。
在一种可能的实现方式中,所述基于所述鼓声音频和节奏点预测神经网络模型,确定所述待检测音频的多种类型的节奏点,包括:
将所述鼓声音频输入到所述节奏点预测神经网络模型中,得到所述待检测音频的多种类型的节奏点。
在一种可能的实现方式中,所述基于所述鼓声音频和节奏点预测神经网络模型,确定所述待检测音频的多种类型的节奏点,包括:
将所述鼓声音频输入到所述节奏点预测神经网络模型中,得到所述待检测音频的多个节奏点;
基于所述鼓声音频在每个节奏点的能量,确定每个节奏点的类型。
在一种可能的实现方式中,所述基于所述鼓声音频在每个节奏点的能量,确定每个节奏点的类型,包括:
确定低频、中频和高频的频域范围;
检测所述鼓声音频在各个节奏点的低频能量、中频能量和高频能量;
对于每个节奏点,如果所述鼓声音频在所述节奏点的低频能量满足目标低频能量特征,则确定所述节奏点为低频节奏点,如果所述鼓声音频在所述节奏点的中频能量满足目标中频能量特征,则确定所述节奏点为中频节奏点,如果所述鼓声音频在所述节奏点的高频能量满足目标高频能量特征,则确定所述节奏点为高频节奏点。
在一种可能的实现方式中,所述方法还包括:
获取多个训练音频;
对每个训练音频进行音轨分离,得到多个训练鼓声音频;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911354005.3/2.html,转载请声明来源钻瓜专利网。