[发明专利]一种音频识别方法、电子设备及可读存储介质在审

申请号：	202210899347.9	申请日：	2022-07-28
公开（公告）号：	CN115203342A	公开（公告）日：	2022-10-18
发明（设计）人：	陆劲鸿	申请（专利权）人：	腾讯音乐娱乐科技（深圳）有限公司
主分类号：	G06F16/28	分类号：	G06F16/28;G10L15/02;G10L15/08
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	万欣慰
地址：	518052 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种音频识别方法电子设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种音频识别方法、电子设备及可读存储介质，该方法包括：获取预设音频，并分别提取各个预设音频对应的预设音频特征；对预设音频特征进行聚类处理，得到多个音频特征组；分别在各个音频特征组内选择标准音频特征，并利用标准音频特征构成音频特征库；获取终端发送的待识别音频；其中，待识别音频由终端对应的收音设备获取；提取待识别音频的待识别音频特征；基于待识别音频特征，在音频特征库的各个标准音频特征中确定与待识别音频特征最相似的目标音频特征；向终端发送目标音频特征对应的目标音频信息；该方法通过聚类和标准音频特征的提取，在保证音频识别的可靠性的同时，能够大幅度减少音频特征库的数据量。

技术领域

本申请涉及音频处理技术领域，特别涉及一种音频识别方法、电子设备及计算机可读存储介质。

背景技术

线上歌曲识别，是指用户通过自我哼唱或采集其它设备播放的片段音频来请求服务，然后识别出所对应的歌曲信息。歌曲识别需要一个庞大的歌曲库来支撑整个服务，单单原唱歌曲的数量已经数目及多，再加上多个歌手对热门歌曲的翻唱，导致歌曲库中的数据数量更加不可估量。这样一个庞大的歌曲库会引发严重的存储问题。

发明内容

有鉴于此，本申请的目的在于提供一种音频识别方法、电子设备及计算机可读存储介质，在保证音频识别的可靠性的同时，能够大幅度减少音频特征库的数据量。

为解决上述技术问题，第一方面，本申请提供了一种音频识别方法，包括：

获取预设音频，并分别提取各个所述预设音频对应的预设音频特征；

对所述预设音频特征进行聚类处理，得到多个音频特征组；

分别在各个所述音频特征组内选择标准音频特征，并利用所述标准音频特征构成音频特征库；

获取终端发送的待识别音频；其中，所述待识别音频由所述终端对应的收音设备获取；

提取所述待识别音频的待识别音频特征；