[发明专利]乐曲识别方法、装置、电子设备及计算机可读存储介质在审

专利信息
申请号: 202110887131.6 申请日: 2021-08-03
公开(公告)号: CN113593609A 公开(公告)日: 2021-11-02
发明(设计)人: 潘颂声;曹偲;朱一闻;刘华平;赵翔宇;李鹏 申请(专利权)人: 杭州网易云音乐科技有限公司
主分类号: G10L25/51 分类号: G10L25/51;G10L25/27;G10L25/30;G06N3/04;G06N3/08;G06K9/62
代理公司: 北京律智知识产权代理有限公司 11438 代理人: 王辉;阚梓瑄
地址: 310052 浙江省杭州市萧山区钱江世*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 乐曲 识别 方法 装置 电子设备 计算机 可读 存储 介质
【说明书】:

本公开提供一种乐曲识别方法、乐曲识别装置、电子设备及计算机可读存储介质;涉及人工智能技术领域。该乐曲识别方法应用于包括音频输入装置的终端设备,该方法包括:通过音频输入装置接收用户输入的音频;对音频进行分析并确定音频的面貌信息,面貌信息包括无效音频、低信噪比音频或高信噪比音频;当面貌信息指示音频为低信噪比音频时,根据低信噪比识别策略对音频进行识别,并输出低信噪比识别结果;当面貌信息指示音频为高信噪比音频时,根据高信噪比识别策略对音频进行识别,并输出高信噪比识别结果;基于低信噪比识别结果或高信噪比识别结果确定所识别到的乐曲。本公开可以针对各种场景和音频进行有效的识别,并输出准确率较高的匹配结果。

技术领域

本公开涉及人工智能技术领域,具体而言,涉及基于人工智能技术的一种乐曲识别方法、乐曲识别装置、电子设备及计算机可读存储介质。

背景技术

本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

伴随着文娱需求的日益增长,越来越多的用户试图通过音频片段来搜索心仪的乐曲。这种通过一段音频来识别对应的乐曲的方式可以被称为“听声识曲”。现有的用于听声识曲的主要方式可以包括:音频指纹识别、翻唱识别和哼唱识别。然而,在单独应用上述方式中的一种时,往往对于低信噪比的音频无法进行有效识别,或者对于例如现场演奏或大幅度改编的歌曲无法进行有效识别,从而造成识别准确率下降、匹配到错误的识别结果等,严重影响用户体验。

因此,需要一种改进的乐曲识别方法和装置,以至少能够针对各种场景和音频进行有效的识别,并输出准确率较高的匹配结果。

发明内容

鉴于此,需要一种乐曲识别方案,能够至少在一定程度上解决由低信噪比音频或大幅度改编的歌曲所造成的单一一种听声识曲技术识别准确率不良、匹配到错误的乐曲的问题。

在本上下文中,本公开的实施方式期望提供一种乐曲识别方法、乐曲识别装置、电子设备及计算机可读存储介质。

根据本公开的第一方面,提供了一种乐曲识别方法,应用于包括音频输入装置的终端设备,其特征在于,所述方法包括:通过音频输入装置接收用户输入的音频;对所述音频进行分析并确定所述音频的面貌信息,所述面貌信息包括无效音频、低信噪比音频或高信噪比音频;当所述面貌信息指示所述音频为低信噪比音频时,根据低信噪比识别策略对所述音频进行识别,并输出低信噪比识别结果;当所述面貌信息指示所述音频为高信噪比音频时,根据高信噪比识别策略对所述音频进行识别,并输出高信噪比识别结果;基于所述低信噪比识别结果或所述高信噪比识别结果确定所识别到的乐曲。

可选地,所述对所述音频进行分析并确定所述音频的面貌信息,包括:对所述音频进行分帧处理,以得到多个音频帧;分别计算各音频帧属于有效音频帧的概率,当所述属于有效音频帧的概率大于或等于预设的第一阈值时,将对应的音频帧确定为有效音频帧;否则,将对应的音频帧确定为无效音频帧;统计有效音频帧的数量,并计算有效音频帧的数量与所述多个音频帧的数量的比值;当所述比值小于预设的第二阈值时,确定所述面貌信息为无效音频并停止对所述音频的识别。

可选地,所述方法还包括:当所述比值大于或等于所述第二阈值时,基于所述有效音频帧的数量计算所述属于有效音频帧的概率的均值;当所述均值大于或等于预设的第三阈值时,确定所述面貌信息为高信噪比音频;否则,确定所述面貌信息为低信噪比音频。

可选地,所述低信噪比识别策略包括多个识别子策略,所述根据低信噪比识别策略对所述音频进行识别,包括:按照预设的顺序依次调用所述多个识别子策略对所述音频进行识别,并基于预设的曲库依次确定通过各识别子策略识别到的至少一个识别子结果以及所述至少一个识别子结果与所述曲库中的对应乐曲之间的低信噪比相似度;当与所述多个识别子策略中的一个识别子策略对应的低信噪比相似度大于或等于预设的第四阈值时,将与该识别子策略对应的乐曲确定为识别到的乐曲并且停止调用识别子策略对所述音频进行识别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110887131.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top