[发明专利]音乐识别方法、音乐特征提取模型的训练方法及装置在审
申请号: | 202111322398.7 | 申请日: | 2021-11-09 |
公开(公告)号: | CN114023289A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 刘云峰;王艺鹏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G06N3/04;G06N3/08;G10L25/18;G10L25/24;G10L25/30;G10L25/51 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 识别 方法 特征 提取 模型 训练 装置 | ||
本公开提供了一种音乐识别方法、音乐特征提取模型的训练方法及装置,涉及人工智能技术领域,尤其涉及音频处理和智能推荐技术领域。实现方案为:确定待识别音频中的音乐片段,音乐片段为包含音乐成分的音频片段;提取音乐片段的第一特征向量;以及基于第一特征向量,从音乐库中确定与待识别音频相匹配的至少一个目标音乐。
技术领域
本公开涉及人工智能技术领域,尤其涉及音频处理和智能推荐技术领域,具体涉及一种音乐识别方法及装置、音乐特征提取模型的训练方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
通常采用基于文本的搜索方式来搜索音乐,即,通过匹配用户输入的搜索词(例如音乐名、演唱者、演奏者、歌词等)与音乐库中的各个音乐的属性信息来得到搜索结果。在用户对待搜索的音乐不熟悉(例如用户不知道待搜索的音乐的名称、演唱者等信息)的情况下,上述搜索方式难以得到令人满意的搜索结果。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
本公开提供了一种音乐识别方法及装置、音乐特征提取模型的训练方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
根据本公开的一方面,提供了一种音乐识别方法,包括:确定待识别音频中的音乐片段,音乐片段为包含音乐成分的音频片段;提取音乐片段的第一特征向量;以及基于第一特征向量,从音乐库中确定与待识别音频相匹配的至少一个目标音乐。
根据本公开的一方面,提供了一种音乐特征提取模型的训练方法,获取样本片段元组,其中,所述样本片段元组包括第一样本音乐片段和第二样本音乐片段,所述样本片段元组标注有匹配标签,所述匹配标签用于表示所述第一样本音乐片段和所述第二样本音乐片段是否属于相同的样本音乐;提取所述第一样本音乐片段的第一频谱特征和所述第二样本音乐片段的第二频谱特征;分别将所述第一频谱特征和所述第二频谱特征输入所述音乐特征提取模型,以得到所述第一样本音乐片段对应的第一样本特征向量和所述第二样本音乐片段对应的第二样本特征向量;基于所述匹配标签和所述第一样本特征向量与所述第二样本特征向量的距离,计算所述音乐特征提取模型的损失值;以及基于所述损失值,调整所述音乐特征提取模型的参数。
根据本公开的一方面,提供了一种音乐识别装置,包括:第一确定模块,被配置为确定待识别音频中的音乐片段,音乐片段为包含音乐成分的音频片段;提取模块,被配置为提取音乐片段的第一特征向量;以及第二确定模块,被配置为基于第一特征向量,从音乐库中确定与所述待识别音频相匹配的至少一个目标音乐。
根据本公开的一方面,提供了一种音乐特征提取模型的训练装置,获取模块,被配置为获取样本片段元组,其中,所述样本片段元组包括第一样本音乐片段和第二样本音乐片段,所述样本片段元组标注有匹配标签,所述匹配标签用于表示所述第一样本音乐片段和第二样本音乐片段是否属于相同的样本音乐;提取模块,被配置为提取所述第一样本音乐片段的第一频谱特征和所述第二样本音乐片段的第二频谱特征;输入模块,被配置为分别将所述第一频谱特征和所述第二频谱特征输入所述音乐特征提取模型,以得到所述第一样本音乐片段对应的第一样本特征向量和所述第二样本音乐片段对应的第二样本特征向量;计算模块,被配置为基于所述匹配标签和所述第一样本特征向量与所述第二样本特征向量的距离,计算所述音乐特征提取模型的损失值;以及调整模块,被配置为基于所述损失值,调整所述音乐特征提取模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111322398.7/2.html,转载请声明来源钻瓜专利网。