[发明专利]一种音频分类方法、装置及存储介质在审
申请号: | 202011324279.0 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112380382A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 张文文;李岩;姜涛 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06F16/683 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李静文 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 分类 方法 装置 存储 介质 | ||
本申请公开了一种音频分类方法、装置及存储介质,涉及音频处理领域,以挖掘出当前最新的,播放热度高的歌曲。该方法中,通过目标音频的音频指纹获取对应的音频检索资源,并将目标指纹分别与对应的音频检索资源进行指纹匹配,从而得到目标指纹的待分类音频集合。将目标音频与待分类音频集合中的各待分类音频进行分类,得到分类结果。这样,通过对目标音频的音频分类,可以得到目标音频分类后的音频,从而在较多的音频内容中,提高音频分类的准确性。
技术领域
本申请涉及音频处理领域,尤其涉及一种音频分类方法、装置及存储介质。
背景技术
伴随短视频应用的普及,音频检索被广泛应用在如今的多媒体内容理解中,特别是基于指纹检索的音频检索技术。但在实际应用中,该技术一般应用于识别用户音频中包含哪首歌,所识别的歌曲必须得是已包含在曲库的内容。随着音频内容的海量增长,检索人员获取当前较为受欢迎的音频较为困难,因此,在相关技术中,存在对音频分类不准确的问题。
发明内容
本申请实施例提供一种音频分类方法、装置及存储介质,以提高音频分类的准确性。
根据本申请实施例的第一方面,提供一种音频分类方法,包括:
获取目标音频对应的至少一个音频检索资源;其中,所述音频检索资源是根据所述目标音频从音频指纹库中进行音频指纹检索得到的,每个音频检索资源具有对应所述目标音频中至少一个音频指纹;
将所述目标音频分别与对应的音频检索资源进行指纹匹配,得到与所述目标音频具有连续相同音频指纹的至少一个待分类音频;
将所述目标音频与各待分类音频进行分类,得到用于表示所述目标音频和各待分类音频的分类结果。
在一种可能的实现方式中,将所述目标音频分别与对应的音频检索资源进行指纹匹配,得到与所述目标音频具有连续相同音频指纹的至少一个待分类音频之前,所述方法还包括:
按照具有对应所述目标音频中音频指纹的数量,对所述目标音频对应的音频检索资源进行筛选;
将筛选的预设数量音频检索资源作为所述目标音频对应的音频检索资源。
在一种可能的实现方式中,通过以下方法对所述目标音频对应的音频检索资源进行筛选:
筛选相同音频指纹的数量超过预设阈值的音频;或;
按照相同音频指纹的数量从高到低的排列顺序,筛选预设数量的音频。
在一种可能的实现方式中,所述将所述目标音频分别与对应的音频检索资源进行指纹匹配,得到与所述目标音频具有连续相同音频指纹的至少一个待分类音频,包括:
将所述目标音频分别与对应的音频检索资源进行指纹匹配,得到所述目标音频与各音频检索资源的指纹匹配的指纹数量;
按照所述指纹数量从所述目标音频对应的各音频检索资源中,获得与所述目标音频具有连续相同音频指纹的待分类音频。
在一种可能的实现方式中,所述按照所述指纹数量从所述目标音频对应的各音频检索资源中,获得与所述目标音频具有连续相同音频指纹的待分类音频,包括:
根据每个音频指纹的时间戳,确定所述目标音频与对应的音频检索资源中连续的相同音频指纹的起始时间和结束时间;
若存在所述目标音频与音频检索资源中连续的相同音频指纹的所述结束时间和所述起始时间之间的差值大于预设阈值,则将所述音频检索资源作为待分类音频。
在一种可能的实现方式中,所述将该目标音频与所述待分类音频集合中的各待分类音频进行分类,得到用于表示该目标音频和各待分类音频的分类结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011324279.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改性邻苯二甲腈树脂及制备方法
- 下一篇:一种激光清洗隔离开关设备