[发明专利]音频文件更新方法及更新装置有效
申请号: | 201210178882.1 | 申请日: | 2012-06-01 |
公开(公告)号: | CN103455513B | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | 陈剑锋 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 郭晶 |
地址: | 510000 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频文件 更新 方法 装置 | ||
技术领域
本发明涉及音频文件处理技术,尤其涉及一种音频文件更新方法及更新装置。
背景技术
音乐云存储是指将用户本地的歌曲存储到服务器端,然后用户可以通过各种终端访问或下载到存储的音乐。在部分情况下,用户会有升级歌曲的需求,即从服务器下载更高质量的歌曲并替换本机保存的歌曲。
现有技术中,在服务器端查找是否具有某个歌曲时都是通过文件名或者音频文件元数据匹配来实现的。然而,当文件名或者元数据不规范甚至发生错误时,就会产生错误判断。
发明内容
有鉴于此,有必要提供一种音频文件更新方法及更新装置,其可避免由于文件名和元数据错误带来的误操作。
一种音频文件的更新方法,其包括:提取待更新音频文件的音频指纹;将待更新音频文件的音频指纹上传至服务器,服务器将待更新音频文件的音频指纹与音频指纹数据库中的音频指纹进行匹配;及若匹配成功,下载并接收服务器返回的音频文件并利用该服务器返回的音频文件更新该待更新的音频文件。
一种音频文件更新装置,包括:音频指纹提取单元,用于提取待更新音频文件的音频指纹;上传单元,用于该待更新音频文件的音频指纹上传至服务器,服务器将该待更新音频文件的音频指纹与音频指纹数据库中的音频指纹进行匹配;及更新单元,用于若服务器匹配成功,下载并接收服务器返回的音频文件并利用该服务器返回的音频文件更新该待更新的音频文件。
在上述的音频文件更新方法、更新装置及更新系统中,通过构建音频指纹数据库,在音频文件更新时采用音频指纹实现音频文件的识别,可以避免由于文件名和元数据错误带来的误操作。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1为第一实施例提供的构建音频指纹数据库的流程图。
图2为第一实施例的构建音频指纹数据库中提取音频指纹的流程图。
图3为第二实施例提供的音频文件更新方法流程图。
图4为第三实施例提供的音频文件更新方法流程图。
图5为第四实施例提供的音频文件更新装置的结构框图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的音频文件的更新方法、更新装置及更新系统的具体实施方式、结构、特征及其功效,详细说明如后。
图1为第一实施例提供的构建音频指纹数据库的流程图。如图1所示,该方法包括:
步骤S110、遍历乐库内的每一音频文件;此步骤是获得乐库内所有音频文件的集合,并逐个对音频文件进行处理;
步骤S120、在遍历过程中,每次输出一个待处理的音频文件;
步骤S130、提取待处理的音频文件的著录信息并保存至音频指纹数据库内; 上述的著录信息例如可包括音频文件的ID、名称、演唱者、作词者、作曲者、专辑名称等等信息。
步骤S140、提取待处理的音频文件的音频指纹并保存于音频指纹数据库内;可以理解,在音频指纹数据库内,每个音频文件的著录信息与音频指纹是对应保存的,即音频指纹与著录信息可以互为索引进行匹配检索。
参阅图2,其为提取音频文件的音频指纹,即步骤S140的具体步骤流程示意图,其包括:
步骤S141、判断音频文件是否为WAV格式。当该音频文件为WAV格式,则转到步骤S143;当该音频文件不为WAV格式,则转到步骤S142。
步骤S142、将该音频文件转换为WAV格式;在WAV格式中,音频数据是以脉冲编码调制(Pulse-code modulation,PCM)数据格式进行保存的,因此,上述转换过程实际上就是采用转码器将音频文件转换为PCM数据。
步骤S143、采用汉明窗(Hamming Window)对该音频文件进行分帧处理;此外,可以理解,并不限于仅采用汉明窗,例如,还可采用矩形窗等。
步骤S144、对每帧进行快速傅立叶变换(Fast Fourier Transform,FFT)得到每帧的能量频谱。
步骤S145、按照吠声标度(Bark Scale)将每帧分为若干份,可以理解,具体的份数取决于子指纹的位数。本实施例中,将其分为32份。
步骤S146、针对每帧计算出其子指纹,如上所述,本实施例中由于将每帧分为32份,其子指纹相应为32位的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210178882.1/2.html,转载请声明来源钻瓜专利网。