[发明专利]音频文件的推送方法及装置有效

申请号：	201510991634.2	申请日：	2015-12-25
公开（公告）号：	CN106919583B	公开（公告）日：	2020-11-10
发明（设计）人：	傅鸿城	申请（专利权）人：	广州酷狗计算机科技有限公司
主分类号：	G06F16/632	分类号：	G06F16/632
代理公司：	北京康信知识产权代理有限责任公司 11240	代理人：	董文倩;李灵洁
地址：	510000 广东省广州***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频文件推送方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种音频文件的推送方法，其特征在于，包括：

获取第一客户端采集到的第一清唱音频数据，其中，所述第一清唱音频数据包括多帧第一音频数据；

根据所述多帧第一音频数据中每一帧第一音频数据上用于表示音高的基频数据获取用于表示所述第一清唱音频数据的音域的第一音频向量，包括：将预定的基频段划分成N个连续的子段，根据每个所述子段中基频数据的数量得到用于表示音域的一维N向量；

根据所述第一音频向量从存储的音频文件集合中查找目标音频文件，其中，所述目标音频文件的第二音频向量与所述第一音频向量相匹配；

将查找到的所述目标音频文件推送给所述第一客户端。

2.根据权利要求1所述的方法，其特征在于，所述多帧第一音频数据为M帧第一音频数据，所述每一帧第一音频数据包括一个所述基频数据，其中，根据每个所述子段中基频数据的数量得到用于表示音域的一维N向量包括：

获取每个所述子段中包含的所述多帧第一音频数据的基频数据的数量{X₁，X₂…X_N}，其中，X_i表示第i个子段中包含的所述多帧第一音频数据的基频数据的数量，1≤i≤N，X₁+X₂+…X_N＝M；

将所述第一音频向量{x₁,x₂,...,x_N}设置为{X₁/M，X₂/M…X_N/M}。

3.根据权利要求2所述的方法，其特征在于，在所述将预定的基频段划分成N个连续的子段之前，还包括：

每隔预定帧移从所述第一清唱音频数据中获取帧长相同的所述多帧第一音频数据，其中，所述预定帧移表示相邻两帧所述第一音频数据的起始位置的间隔；

在所述多帧第一音频数据中每一帧第一音频数据对应的频谱上提取最大值作为所述用于表示音高的基频数据。

4.根据权利要求3所述的方法，其特征在于，所述预定帧移小于所述帧长。

5.根据权利要求1所述的方法，其特征在于，在获取第一客户端采集到的清唱音频数据之前，还包括：

获取所述音频文件集合中每一个音频文件对应的Q个第二清唱音频数据，并将每一个音频文件作为当前音频文件分别执行以下步骤：

每隔预定帧移从所述当前音频文件对应的每一个第二清唱音频数据中获取帧长相同的多帧第二音频数据，其中，所述预定帧移表示相邻两帧所述第二音频数据的起始位置的间隔，所述多帧第二音频数据为P帧第二音频数据；

获取所述每一个第二清唱音频数据中每一帧第二音频数据上一个用于表示音高的基频数据；

依次令j＝1,2,…,P，分别对每帧执行以下操作，以得到P个基频数据，其中，每帧对应一个基频数据：从Q个第二清唱音频数据中的第j帧第二音频数据的基频数据中选择一个基频数据作为第j帧对应的基频数据；

将预定的基频段划分成N个连续的子段；

获取每个所述子段中包含的所述P个基频数据中的基频数据的数量{Y₁，Y₂…Y_N}，其中，Y_i表示第j个子段中包含的所述P个基频数据中的基频数据的数量，1≤j≤N，Y₁+Y₂+…Y_N＝P；

将所述当前音频文件的第二音频向量{y₁,y₂,...,y_N}设置为{Y₁/P，Y₂/P…Y_N/P}。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司，未经广州酷狗计算机科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510991634.2/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载