[发明专利]音频的识别方法及系统在审
申请号: | 201710006772.X | 申请日: | 2017-01-05 |
公开(公告)号: | CN108280074A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 马明 | 申请(专利权)人: | 北京酷我科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L25/51 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 100084 北京市海淀区农大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频指纹 指纹 音频文件 歌曲信息 目标音频 相关度 歌曲 数据库 建立数据库 多个目标 格式音频 准确率 匹配 | ||
本发明实施例涉及一种音频的识别方法及系统。包括:建立数据库,所述数据库包括多个音频指纹,所述音频指纹包括多个子指纹,所述多个音频指纹分别对应有音频文件,所述音频文件包括歌曲信息;确定待识别音频文件的目标音频指纹,所述目标音频指纹包括多个目标子指纹;将所述目标子指纹与所述数据库中的子指纹进行匹配,确定所述多个音频指纹中的每个与所述目标音频指纹的相关度;根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。可以针对各种格式音频文件根据音频文件的音频指纹来标识歌曲,即使更改歌曲的歌手名、专辑名等信息,音频指纹也是不会改变,识别准确率更高。
技术领域
本发明涉及音频数据处理技术领域,尤其涉及一种音频的识别方法及系统。
背景技术
对于音频文件一般包括用于存储歌手、标题、专辑名称、年代以及风格等标识信息的数据段,例如,对于MP3格式的音频文件,一般在该MP3音频文件的ID3信息中存储标识信息。在播放音频文件时,通常通过读取存储有标识信息的数据段中的标识信息,将该标识信息显示在播放界面,提供给用户。
但是,随着技术的不断进步,出于为了规避版权等等原因,可轻易的对音频文件中存储标识信息的数据段进行修改或者删除。对于这类音频文件,在进行播放时,将会出现无法正确识别歌曲的情况,这势必会影响歌曲的欣赏体验。
发明内容
本发明实施例提供了一种音频指纹的生成方法及系统。通过提取音频文件中的取出并计算得到的一串标识符作为音频文件的音频指纹,以此来标识歌曲,可在ID3信息等改变后,依然可以正确识别歌曲。
一方面,本发明实施例提供了一种音频的识别方法。包括:
建立数据库,所述数据库包括多个音频指纹,所述音频指纹包括多个子指纹,所述多个音频指纹分别对应有音频文件,所述音频文件包括歌曲信息;
确定待识别音频文件的目标音频指纹,所述目标音频指纹包括多个目标子指纹;
将所述目标子指纹与所述数据库中的子指纹进行匹配,确定所述多个音频指纹中的每个与所述目标音频指纹的相关度;
根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。
可选地,所述多个音频指纹中的每个与所述目标音频指纹的相关度至少包括下述一项或多项:
所述多个音频指纹中的每个对应的多个子指纹与所述多个目标子指纹匹配成功的个数;
匹配成功的子指纹在所述目标音频指纹与所述多个音频指纹中的每个的位差异程度;
所述多个音频指纹中的每个对应的音频文件的时长;
所述多个音频指纹中的每个对应的音频文件的码率;
所述多个音频指纹中的每个对应的音频文件与所述待识别音频文件的歌曲信息的相似度。
可选地,所述确定所述多个音频指纹中的每个与所述目标音频指纹的相关度包括:
确定所述多个音频指纹中的每个对应的多个子指纹与所述目标子指纹匹配成功的个数。
可选地,根据所述多个音频指纹对应的相关度,在所述多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息包括:
根据所述多个音频指纹中的每个匹配成功的个数,选择所述多个音频指纹中符合预制规则的多个音频指纹;
确定所述目标音频指纹与所述符合预制规则的多个音频指纹中的每个的位差异程度;
根据所述符合预制规则的多个音频指纹对应的位差异程度,在所述符合预制规则的多个音频指纹对应的歌曲信息中选择所述待识别歌曲的歌曲信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京酷我科技有限公司,未经北京酷我科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710006772.X/2.html,转载请声明来源钻瓜专利网。