[发明专利]声音监控方法、装置及系统在审
申请号: | 201310332073.6 | 申请日: | 2013-08-01 |
公开(公告)号: | CN103971702A | 公开(公告)日: | 2014-08-06 |
发明(设计)人: | 何勇军;孙广路;谢怡宁;刘嘉辉 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/21 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 监控 方法 装置 系统 | ||
1.一种声音监控方法,其特征在于,包括训练声音阶段和检测声音阶段,
所述训练声音阶段包含步骤:
S1、获取训练声音信号,提取所述训练声音信号的训练声音特征;
S2、根据所述训练声音特征训练声音事件模型;
所述检测声音阶段包含步骤:
S3、获取待检测声音信号,提取所述待检测声音信号的待检测声音特征;
S4、判断所述声音事件模型中是否存在至少一个与所述待检测声音特征匹配的声音事件模型,如为是,则判定存在暴力事件;如为否,判定不存在暴力事件。
2.如权利要求1所述的声音监控方法,其特征在于,步骤S1或步骤S3中包含步骤:
S11、对获取的声音信号进行预处理;
S12、对预处理过后的声音信号作离散傅立叶变换,求得功率谱;
S13、基于梅尔滤波器组求得所述功率谱的梅尔倒谱系数;
S14、计算所述梅尔倒谱系数的一阶差分和二阶差分,将所述一阶差分和二阶差分的系数与所述梅尔倒谱系数拼接,形成声音特征。
3.如权利要求2所述的声音监控方法,其特征在于,
步骤S11中的预处理包括分帧操作和加窗操作;
其中,加窗操作采用的窗函数为汉明窗,表达式w(n)为:
式中n为时间序号,L为窗长;
步骤S12中所述的求功率谱的表达式Xa(k)为:
式中x(n)为加窗后的语音帧,N表示傅立叶变换的点数,j表示虚数单位。
4.如权利要求1所述的声音监控方法,其特征在于,步骤S2中的通过高斯混合模型来训练声音暴力事件模型,所述的M阶高斯混合模型的概率密度函数如下:
其中,
式中,λ={ci,μi,Σi;(i=1...M)},μi为均值矢量,Σi为协方差矩阵,i=1,2,..M。矩阵Σi在这里采用对角阵:
5.如权利要求1所述的声音监控方法,其特征在于,步骤S4包含以下步骤:
S31、假定声音事件模型有N个,每个声音事件模型通过一个高斯混合模型建模,分别为λ1,λ2,...,λN,在判断阶段,输入的观测所述待检测声音特征集为O={o1,o2,...,oT},T为输入声音的帧数;
S32、计算所述待检测声音为第n个声音事件模型的后验概率,1≤n≤N;
S33、根据所述后验概率得到预判结果;
S34、根据所述预判结果得到最终的判决结果。
6.如权利要求5所述的声音监控方法,其特征在于,
步骤S32中的计算后验概率表达式为:
式中,p(λn)为第n个声音事件模型的先验概率;p(O)为所有声音事件模型条件下所述待检测声音特征集O的概率;p(O|λn)为第n个声音事件模型产生所述待检测声音特征集O的条件概率。
7.如权利要求5所述的声音监控方法,其特征在于,
步骤S33中的计算预判结果表达式为:
式中,p(λn)为第n个声音事件模型的先验概率;p(O)为所有声音事件模型条件下所述待检测声音特征集O的概率;P(λn|ot)为ot产生于λn的概率。
8.如权利要求5所述的声音监控方法,其特征在于,
步骤S34中的计算判决结果表达式为:
式中,p(λn)为第n个声音事件模型的先验概率;p(O)为所有声音事件模型条件下所述待检测声音特征集O的概率;为ot产生于 的概率;threshold为预设的拒识门限。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310332073.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:同步无纺布复合机放卷装置
- 下一篇:一种联系人语音搜索方法、装置及移动终端