[发明专利]一种构建在线实时更新海量音频指纹库的方法和设备有效
| 申请号: | 201510079627.5 | 申请日: | 2015-02-13 |
| 公开(公告)号: | CN104679847B | 公开(公告)日: | 2019-03-15 |
| 发明(设计)人: | 王磊 | 申请(专利权)人: | 高第网络技术(北京)有限公司 |
| 主分类号: | G06F16/61 | 分类号: | G06F16/61 |
| 代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 石宝忠 |
| 地址: | 102208 北京市昌平区回龙*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 构建 在线 实时 更新 海量 音频 指纹 方法 设备 | ||
本发明提供一种构建在线实时更新音频指纹库的方法和设备,解决现有技术中海量音频指纹库不方便在线实时更新的技术问题。其中,构建在线实时更新音频指纹库的方法,包括:建立具有相同key值的音频指纹与所述key值的对应关系;建立包含每个key值与其对应音频指纹的索引列表,使索引列表中的每一个key值均以指针的形式指向其对应的音频指纹;以及将具有相同key值的音频指纹连续存储。本发明可使在线服务引擎支持实时添加、删除歌曲指纹,而且不会影响搜索服务,避免了离线建库、重启服务所带来的繁琐和耗时的工作,同时保证了海量音频指纹库的数据时效性,实现了秒级的数据更新需求响应能力。
技术领域
本发明涉及音频指纹识别技术领域,具体涉及一种构建在线实时更新海量音频指纹库的方法和设备。
背景技术
音频指纹识别(俗称“听音识曲”)是一种新兴的音乐搜索技术,该技术通过分析音频文件的频谱,提取称为“音频指纹”的数字特征,并使用数字特征构建“海量音频指纹库”,部署于网络服务器上,客户端可将录制的未知音频片段发送到服务器,服务器使用相同的算法提取“音频指纹”,然后通过搜索算法在海量音频指纹库中查找相似特征,并根据找到的若干特征推测目标音频文件,将结果返回给客户端即完成了整个识别过程。音频指纹识别是一种兼具数据密集型和计算密集型的应用:海量音频指纹库必须包含足够多的音频文件的特征,才能保证应用的识别率,该规模通常为千万级;搜索算法的计算量巨大,为了保证搜索速度,通常首先离线构建指纹库,并进行序列化处理生成一个文件,以使数据连续存储,避免过多指针跳转操作,然后将索引文件完全加载到内存中提供检索服务。
现有技术中海量音频指纹库的更新方法,由于索引数据连续存储在一块内存中,通常的解决方案很难支持在线添加、删除音频指纹索引数据,故每次更新均需将服务器重启。图1所示,现有的解决方案一般将海量音频指纹索引库划分为多个固定小的音频指纹库(块1、块2……块n),积攒一定数量的新数据后,需要离线重建最后一个不满的音频指纹库(块n),然后重新启动服务(重启服务更新块n),将最新的音频指纹库替换到线上。由此可知,离线建库,重启服务的索引数据更新方法具有操作繁琐、更新不及时等固有缺陷,无法提供及时的新歌搜索服务,因此,研发一种在线实时更新海量音频指纹库索引数据的方法成为一种必需。
发明内容
为此,本发明提供一种构建在线实时更新音频指纹库的方法和设备,解决现有技术中海量音频指纹库不方便在线实时更新的技术问题。
为此,本发明提供一种构建在线实时更新音频指纹库的方法,包括:建立具有相同key值的音频指纹与所述key值的对应关系;建立包含每个key值与其对应音频指纹的索引列表,使索引列表中的每一个key值均以指针的形式指向其对应的音频指纹;以及将具有相同key值的音频指纹连续存储。
根据本发明的一个实施方式,其中,建立具有相同key值的音频指纹与所述key值的对应关系包括:将具有相同key值的音频指纹划分为同一数组;并且其中,建立包含每个key值与其对应音频指纹的索引列表包括:使所述索引列表包括数量与key值数量相同的数组。
根据本发明的一个实施方式,其中,进一步包括:在线添加音频指纹,包括:将待添加音频指纹按照其对应key值进行分组,每组中的所述待添加音频指纹具有相同的对应key值;在所述索引列表中查找与所述对应key值相同的key值,以定位待更新音频指纹;复制所述待更新音频指纹;将具有相同key值的待更新音频指纹和所述待添加音频指纹连续存放,以获得新音频指纹;将所述索引列表中指向所述待更新音频指纹的key值的指针,指向所述新音频指纹;将所述待更新音频指纹延迟删除。
根据本发明的一个实施方式,其中,若所述待添加音频指纹中的key值不包含在所述索引列表中,则将其视为新建key值;将所述新建key值连续添加至所述索引列表中后,将与所述新建key值相对应的音频指纹连续存放在所述待更新音频指纹中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高第网络技术(北京)有限公司,未经高第网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510079627.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种播放列表创建方法及终端设备
- 下一篇:数据访问处理方法和装置





