[发明专利]一种基于GMM-UBM的冲击声模型建立、冲击声检测方法及系统在审
申请号: | 202011624452.9 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112820318A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 刘芳;向阳;黄绍锋;王向辉 | 申请(专利权)人: | 西安合谱声学科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/03;G10L25/21;G10L25/27 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 王芳 |
地址: | 712000 陕西省西安市西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gmm ubm 冲击 模型 建立 检测 方法 系统 | ||
本发明属于音频信号的获取与处理领域,公开了一种基于GMM‑UBM的冲击声模型建立、冲击声检测方法及系统。模型建立方法包括:获取麦克风拾取的音频信号;音频信号的MFCC计算;样本数据的GMM‑UBM数据训练;冲击声检测方法包括测试音频的冲击声判决。本发明对冲击声有较好的检测效果。本发明具有检测结果对环境噪声鲁棒、对信噪比鲁棒、方法运算复杂度低、易于实现等优点。
技术领域
本发明属于音频信号的获取与处理领域,具体涉及一种基于GMM-UBM的冲击声模型建立、冲击声检测方法及系统。
背景技术
随着信息化和网络化技术的发展,安全监控在国防和社会安全中所起的作用越来越突出,声音信号在日常生活中无处不在,包含的信息量大,而公共场合的声音可以有效的表征现场的安全性。冲击声特指环境中出现的一些突兀的声音,例如枪声、急促的刹车声、爆炸声、尖叫声等。由于声音是全向传播的,不受光线影响,所以检测冲击声音理论上是可以的。但是冲击声音的种类繁多,姑且不说有尖叫声、枪声等不同异常声音,即使是枪声这一种异常声音也有手枪、步枪等,同时现实生活中的外界干扰也很多,所以准确判断出冲击声还是很困难。
然而,传统的冲击声检测方法一般都是对某一种冲击声进行检测,并且冲击声通常持续时间短,频率分辨率不高,因此使用传统的检测的方法对冲击声的检测有一定的局限性。
发明内容
本发明的目的在于提供一种基于GMM-UBM的冲击声模型建立、冲击声检测方法及系统,用以解决现有技术中的嘈杂环境下的冲击声难以检测的问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于GMM-UBM的冲击声模型建立方法,包括如下步骤:
步骤1:获取非冲击声信号样本数据集,计算每个非冲击声信号的MFCC参数,获得非冲击声信号的MFCC特征向量;
步骤2:根据非冲击声信号的MFCC特征向量建立UBM模型,利用最大期望算法训练UBM模型,获得训练好的UBM模型和训练好的模型参数,将训练好的UBM模型作为背景声模型;
步骤3:获取冲击声信号样本数据集,计算每个冲击声信号的MFCC参数,获得冲击声信号的MFCC特征向量;
步骤4:根据冲击声信号的MFCC特征向量建立GMM模型,将步骤2训练好的模型参数通过最大后验估计方法传递给GMM模型,获得参数更新后的GMM模型,将参数更新后的作为冲击声模型。
进一步的,所述非冲击声信号的MFCC特征参数和冲击声信号的MFCC特征参数的维数均为42维。
一种基于GMM-UBM的冲击声检测方法,包括如下步骤:
步骤a:通过麦克风拾取时域音频信号;
步骤b:计算时域音频信号的MFCC参数,得到时域音频信号的MFCC特征向量X;
步骤c:通过式Ⅰ计算时域音频信号的对数似然比Λ(X),当Λ(X)0时,判定时域音频信号是冲击声信号,否则判定时域音频信号为非冲击声信号;
Λ(X)=log(p(X|GMM))-log(p(X|UBM)) 式Ⅰ
其中,GMM为冲击声模型,UBM为背景声模型,log(p(·))是log域的似然函数。
进一步的,所述时域音频信号的MFCC特征向量的维数为42维。
一种基于GMM-UBM的冲击声模型建立系统,包括样本采集模块、模型建立模块、训练模块和参数传递模块;
所述的样本采集模块用于获取非冲击声信号样本数据集和冲击声信号样本数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安合谱声学科技有限公司,未经西安合谱声学科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011624452.9/2.html,转载请声明来源钻瓜专利网。