[发明专利]歌手识别方法、装置、设备及存储介质在审

专利信息
申请号: 202110542271.X 申请日: 2021-05-18
公开(公告)号: CN113284501A 公开(公告)日: 2021-08-20
发明(设计)人: 张旭龙;王健宗 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G10L17/02 分类号: G10L17/02;G10L17/04;G10L17/14;G10L25/12;G10L25/18;G10L25/24;G06N3/04;G06K9/62;G06F16/635
代理公司: 深圳市明日今典知识产权代理事务所(普通合伙) 44343 代理人: 王杰辉;陈秋波
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 歌手 识别 方法 装置 设备 存储 介质
【说明书】:

本申请涉及人工智能技术领域,揭示了一种歌手识别方法、装置、设备及存储介质,其中方法包括:根据待识别的歌曲音频得到待融合的梅尔频谱、待融合的声纹特征、待融合的音乐中层特征;根据待融合的梅尔频谱和待融合的声纹特征得到待分析的融合特征;对待分析的融合特征进行降维处理和特征提取得到待处理的抽象特征;将待处理的抽象特征进行时间序列维度特征的提取得到待融合的时间序列维度特征;根据待融合的时间序列维度特征和待融合的音乐中层特征得到待预测分类的特征数据;根据待预测分类的特征数据进行分类概率预测和歌手确定得到目标歌手。通过声纹特征有效消除伴奏的影响、音乐中层特征增加对歌曲类型或风格的识别,提高歌手识别的准确率。

技术领域

本申请涉及到人工智能技术领域,特别是涉及到一种歌手识别方法、装置、设备及存储介质。

背景技术

歌手识别是音乐信息检索领域的一个重要任务,它的目的是在给定的音频中识别出歌手,以便于音乐库的管理。经过适当训练后,歌手识别模型还可以应用于有关歌唱的其他任务,如相似度搜索、播放列表生成或歌声合成等。歌手识别任务主要的两大挑战是伴奏影响与人类发声机制相似。随着深度学习技术的发展,许多学者将深度学习技术应用于歌手识别任务,但是识别准确率还有待提高。

发明内容

本申请的主要目的为提供一种歌手识别方法、装置、设备及存储介质,旨在解决现有技术的将深度学习技术应用于歌手识别任务,但是识别准确率还有待提高的技术问题。

为了实现上述发明目的,本申请提出一种歌手识别方法,所述方法包括:

获取待识别的歌曲音频;

对所述待识别的歌曲音频进行梅尔频谱提取,得到待融合的梅尔频谱;

对所述待识别的歌曲音频进行声纹特征提取,得到待融合的声纹特征;

对所述待融合的梅尔频谱和所述待融合的声纹特征进行融合处理,得到待分析的融合特征;

对所述待分析的融合特征进行降维处理和特征提取,得到待处理的抽象特征;

将所述待处理的抽象特征进行时间序列维度特征的提取,得到待融合的时间序列维度特征;

对所述待识别的歌曲音频进行音乐中层特征的提取,得到待融合的音乐中层特征;

对所述待融合的时间序列维度特征和所述待融合的音乐中层特征进行融合处理,得到待预测分类的特征数据;

根据所述待预测分类的特征数据进行分类概率预测和歌手确定,得到所述待识别的歌曲音频对应的目标歌手。

进一步的,所述对所述待识别的歌曲音频进行声纹特征提取,得到待融合的声纹特征的步骤,包括:

将所述待识别的歌曲音频输入目标歌声分离模型进行人声特征分离,得到待分析的人声特征;

将所述待分析的人声特征输入目标声纹识别模型进行声纹特征提取,得到所述待融合的声纹特征,其中,所述目标声纹识别模型在训练时采用包含噪声和混响的数据增强策略。

进一步的,所述对所述待融合的梅尔频谱和所述待融合的声纹特征进行融合处理,得到待分析的融合特征的步骤,包括:

采用concat方法,对所述待融合的梅尔频谱和所述待融合的声纹特征进行融合处理,得到所述待分析的融合特征。

进一步的,所述对所述待分析的融合特征进行降维处理和特征提取,得到待处理的抽象特征的步骤,包括:

将所述待分析的融合特征输入第一卷积块进行卷积,得到第一卷积特征;

将所述第一卷积特征输入第二卷积块进行卷积,得到第二卷积特征;

将所述第二卷积特征输入第三卷积块进行卷积,得到第三卷积特征;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110542271.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top