[发明专利]获取多媒体文件的方法、装置及计算机可读存储介质有效
申请号: | 201710679015.9 | 申请日: | 2017-08-10 |
公开(公告)号: | CN107368609B | 公开(公告)日: | 2018-09-04 |
发明(设计)人: | 张超钢;黄美红;陈文锋 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L25/54 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 多媒体 文件 方法 装置 计算机 可读 存储 介质 | ||
1.一种获取多媒体文件的方法,其特征在于,所述方法包括:
提取采集的语音信号的参考音符序列,所述参考音符序列包括多个音符;
对于多媒体文件库中的任一多媒体文件,将所述任一多媒体文件的音符序列划分为多个音符子序列,每个音符子序列包括至少一个音符,相邻两个音符子序列之间的交集包括预设数目个音符,所述预设数目为大于或者等于0,且小于指定数值的整数,所述指定数值为所述任一多媒体文件包括音符的数目与划分的音符子序列的数目之商;
基于预设重复度算法,确定所述每个音符子序列之间的重复度;
如果所述每个音符子序列之间的重复度大于预设重复度,确定所述任一多媒体文件的音符序列具有重复结构;
当所述任一多媒体文件的音符序列具有重复结构时,获取所述任一多媒体文件的基准音符子序列,所述基准音符子序列包括至少一个音符,且所述基准音符子序列包括的音符的数目小于所述任一多媒体文件包括的音符的数目;
根据所述参考音符序列和所述任一多媒体文件的基准音符子序列,确定所述语音信号与所述任一多媒体文件之间的匹配度;
根据所述语音信号与所述任一多媒体文件之间的匹配度,从所述多媒体文件库中获取匹配度满足预设条件的目标多媒体文件。
2.根据权利要求1所述的方法,其特征在于,所述基于预设重复度算法,确定所述每个音符子序列之间的重复度,包括:
基于相似矩阵算法,确定所述每个音符子序列之间的至少一个相似矩阵,根据每个相似矩阵,确定所述每个相似矩阵的特征值,根据所述每个相似矩阵的特征值,确定所述每个音符子序列之间的重复度;或者,
基于互相关算法,确定所述每个音符子序列之间的至少一个互相关度,根据每个互相关度,确定所述每个音符子序列之间的重复度;或者,
基于编辑距离算法,确定所述每个音符子序列之间的至少一个编辑距离,根据每个编辑距离,确定所述每个音符子序列之间的重复度;或者,
基于EMD距离算法,确定所述每个音符子序列之间的至少一个EMD距离,根据每个EMD距离,确定所述每个音符子序列之间的重复度。
3.根据权利要求1所述的方法,其特征在于,所述获取所述任一多媒体文件的基准音符子序列,包括:
从所述多个音符子序列中随机选择一个音符子序列作为所述任一多媒体文件的基准音符子序列;或者,
从所述多个音符子序列中选择一个包括音符数最多的音符子序列作为所述任一多媒体文件的基准音符子序列;或者,
从所述多个音符子序列中选择一个包括音符数最少的音符子序列作为所述任一多媒体文件的基准音符子序列。
4.根据权利要求1-3任一所述的方法,其特征在于,所述音符包括音高和/或音长,所述音高为所述音符的绝对音高或者相邻两个音符之间的相对音高。
5.一种获取多媒体文件的装置,其特征在于,所述装置包括:
提取模块,用于提取采集的语音信号的参考音符序列,所述参考音符序列包括多个音符;
划分模块,用于对于多媒体文件库中的任一多媒体文件,将所述任一多媒体文件的音符序列划分为多个音符子序列,每个音符子序列包括至少一个音符,相邻两个音符子序列之间的交集包括预设数目个音符,所述预设数目为大于或者等于0,且小于指定数值的整数,所述指定数值为所述任一多媒体文件包括音符的数目与划分的音符子序列的数目之商;
确定模块,用于基于预设重复度算法,确定所述每个音符子序列之间的重复度;
所述确定模块,还用于如果所述每个音符子序列之间的重复度大于预设重复度,确定所述任一多媒体文件的音符序列具有重复结构;
第一获取模块,用于当所述任一多媒体文件的音符序列具有重复结构时,获取所述任一多媒体文件的基准音符子序列,所述基准音符子序列包括至少一个音符,且所述基准音符子序列包括的音符的数目小于所述任一多媒体文件包括的音符的数目;
所述确定模块,还用于根据所述参考音符序列和所述任一多媒体文件的基准音符子序列,确定所述语音信号与所述任一多媒体文件之间的匹配度;
第二获取模块,用于根据所述语音信号与所述任一多媒体文件之间的匹配度,从所述多媒体文件库中获取匹配度满足预设条件的目标多媒体文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710679015.9/1.html,转载请声明来源钻瓜专利网。