[发明专利]一种逆向爆音检测方法及其装置有效
申请号: | 201611124797.1 | 申请日: | 2016-12-08 |
公开(公告)号: | CN106782612B | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 赵伟峰 | 申请(专利权)人: | 腾讯音乐娱乐(深圳)有限公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 44202 广州三环专利商标代理有限公司 | 代理人: | 郝传鑫;熊永强 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 逆向 检测 方法 及其 装置 | ||
1.一种逆向爆音检测方法,其特征在于,包括:
确定待检测的目标音频文件存在突变时域信号以及存在所述突变时域信号的音频位置;
查找与所述目标音频文件的标签信息和时长信息均相同的备选音频文件;
将所述目标音频文件的频谱能量数字序列分别与每个备选音频文件的频谱能量数字序列进行对比,将与所述目标音频文件的频谱能量数字序列的相同概率达到预设概率值的备选音频文件确定为同源音频文件;
从所述同源音频文件中确定在所述音频位置存在突变时域信号的第一同源音频文件和除所述第一同源音频文件之外的第二同源音频文件;
根据所述第一同源音频文件的数量和所述第二同源音频文件的数量确定所述目标音频文件存在的所述突变时域信号为逆向爆音,所述逆向爆音为音频文件在传播过程中产生的爆音。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一同源音频文件的数量和所述第二同源音频文件的数量确定所述目标音频文件存在的所述突变时域信号为逆向爆音,包括:
检测所述第一同源音频文件的数量是否小于第一阈值且所述第二同源音频文件的数量是否大于第二阈值;
若所述第一同源音频文件的数量小于所述第一阈值且所述第二同源音频文件的数量大于所述第二阈值,则确定所述目标音频文件存在的所述突变时域信号为逆向爆音。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一同源音频文件的数量和所述第二同源音频文件的数量确定所述目标音频文件存在的所述突变时域信号为逆向爆音,包括:
检测所述第一同源音频文件的数量与所述第二同源音频文件的数量的比值是否小于预设比值;
若所述第一同源音频文件的数量与所述第二同源音频文件的数量的比值小于所述预设比值,则确定所述目标音频文件存在的所述突变时域信号为逆向爆音。
4.根据权利要求1所述的方法,其特征在于,所述确定待检测的目标音频文件存在突变时域信号以及存在所述突变时域信号的音频位置,包括:
接收音频文件客户端发送的针对待检测的目标音频文件的突变指示消息,所述突变指示消息指示所述目标音频文件存在突变时域信号,并携带存在所述突变时域信号的音频位置;
根据所述突变指示消息确定所述目标音频文件存在所述突变时域信号以及存在所述突变时域信号的音频位置。
5.根据权利要求1所述的方法,其特征在于,所述确定待检测的目标音频文件存在突变时域信号以及存在所述突变时域信号的音频位置,包括:
根据第一预设算法对待检测的目标音频文件进行处理得到所述目标音频文件的多帧信号;
计算所述目标音频文件的多帧信号中每帧信号的能量信息;
若目标帧信号的能量信息满足预设突变条件,则确定所述目标音频文件存在突变时域信号以及存在所述突变时域信号的音频位置,所述目标帧信号为所述多帧信号中的一个。
6.根据权利要求1所述的方法,其特征在于,所述查找与所述目标音频文件的标签信息和时长信息均相同的备选音频文件,包括:
从所述目标音频文件所属音频文件客户端对应的音频文件数据库和/或所述目标音频文件所属的本地音频文件库中查找与所述目标音频文件的标签信息相同的标签音频文件;
根据第二预设算法对每个标签音频文件和所述目标音频文件进行处理得到所述每个标签音频文件的时长信息和所述目标音频文件的时长信息,所述时长信息包括分帧信号数量;
将与所述目标音频文件的分帧信号数量相同的标签音频文件确定为备选音频文件。
7.根据权利要求1所述的方法,其特征在于,所述将所述目标音频文件的频谱能量数字序列分别与每个备选音频文件的频谱能量数字序列进行对比之前,还包括:
根据第三预设算法对每个备选音频文件和所述目标音频文件进行处理得到所述每个备选音频文件的频谱能量数字序列和所述目标音频文件的频谱能量数字序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐(深圳)有限公司,未经腾讯音乐娱乐(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611124797.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种适用于混响环境的汉语语音清晰度评测算法
- 下一篇:信号检测方法及装置