[发明专利]音频指纹的生成方法及装置有效
申请号: | 201611173755.7 | 申请日: | 2016-12-16 |
公开(公告)号: | CN108205550B | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 吴岩 | 申请(专利权)人: | 北京酷我科技有限公司 |
主分类号: | G06F16/68 | 分类号: | G06F16/68;G06F16/635;G06F16/61 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 100084 北京市海淀区农大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 指纹 生成 方法 装置 | ||
本发明实施例涉及一种音频指纹的生成方法及装置。包括:根据第一音频文件截取基于PCM编码的第二音频文件,所述第二音频文件为在所述第一音频文件第一时间处截取的音频文件;根据所述第二音频文件得到多个子指纹;从第二时间处开始截取所述多个子指纹中的设定数量个子指纹作为所述第一音频文件的音频指纹。可以针对各种格式音频文件提取出并计算得到的一串标识符作为音频文件的音频指纹,以此来标识歌曲,即使更改歌曲的歌手名、专辑名等信息,音频指纹也是不会改变。
技术领域
本发明涉及音频数据处理技术领域,尤其涉及一种音频指纹的生成方法及装置。
背景技术
对于音频文件一般包括用于存储歌手、标题、专辑名称、年代以及风格等标识信息的数据段,例如,对于MP3格式的音频文件,一般在该MP3音频文件的ID3信息中存储标识信息。在播放音频文件时,通常通过读取存储有标识信息的数据段中的标识信息,将该标识信息显示在播放界面,提供给用户。
但是,随着技术的不断进步,出于为了规避版权等等原因,可轻易的对音频文件中存储标识信息的数据段进行修改或者删除。对于这类音频文件,在进行播放时,将会出现无法正确识别歌曲的情况,这势必会影响歌曲的欣赏体验。
发明内容
本发明实施例提供了一种音频指纹的生成方法及装置。通过提取音频文件中的取出并计算得到的一串标识符作为音频文件的音频指纹,以此来标识歌曲,可在ID3信息等改变后,依然可以无法正确识别歌曲。
一方面,本发明实施例提供了一种音频指纹的生成方法,包括:
根据第一音频文件截取基于脉冲编码调制(Pulse Code Modulation,PCM)编码的第二音频文件,所述第二音频文件为在所述第一音频文件第一时间处截取的音频文件;
根据所述第二音频文件得到多个子指纹;
从第二时间处开始截取所述多个子指纹中的设定数量个子指纹作为所述第一音频文件的音频指纹。
可选的,还包括:
确定源音频文件,将所述源音频文件转换为所述第一音频文件。
可选的,所述第一时间为45秒。
可选的,所述第二时间大于32秒,且小于所述第一时间。
可选的,所述设定数量为512。
另一方面,本发明实施例提供了一种在音频文件数据库中添加音频指纹的方法。所述音频文件数据库包括多个音频文件,所述方法包括:
确定所述多个音频文件中未包括音频指纹的至少一个音频文件;
计算所述至少一个音频文件中每个对应的多个子指纹;
生成所述至少一个音频文件中大于第一时间的音频文件的音频指纹,所述音频指纹为从大于第一时间的音频文件的第一时间处开始截取的设定数量个子指纹;
根据所述音频指纹生成数据库语句,并将所述音频指纹添加在所述数据库中。
又一方面,本发明实施例提供了一种音频指纹的生成装置。包括:
截取单元,用于根据第一音频文件截取基于PCM编码的第二音频文件,所述第二音频文件为在所述第一音频文件第一时间处截取的音频文件;
子指纹生成单元,用于根据所述第二音频文件得到多个子指纹;
音频指纹生成单元,用于从第二时间处开始截取所述多个子指纹中的设定数量个子指纹作为所述第一音频文件的音频指纹。
可选的,还包括:
确定单元,用于确定源音频文件,将所述源音频文件转换为所述第一音频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京酷我科技有限公司,未经北京酷我科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611173755.7/2.html,转载请声明来源钻瓜专利网。