[发明专利]音频事件检测系统及方法无效
申请号: | 201010103634.1 | 申请日: | 2010-01-27 |
公开(公告)号: | CN101819770A | 公开(公告)日: | 2010-09-01 |
发明(设计)人: | 胡瑞敏;杭波;马晔;高戈;杨玉红;周成;王晓晨 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L15/02 |
代理公司: | 武汉华旭知识产权事务所 42214 | 代理人: | 周宗贵 |
地址: | 430072*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 事件 检测 系统 方法 | ||
技术领域
本发明涉及音频检测技术领域,尤其涉及一种音频事件检测系统及方法。
背景技术
智能的音频监控中需要对突发事件进行检测,进而采取报警、高质量编码等操作。当前事件检测技术主要应用于离线检测,对音频信号直接应用高斯混合模型(GMM)、隐马尔可夫模型(HMM)等方法进行事件匹配。由于当前事件检测技术在检测音频信号中是否包含突发事件时,需对音频信号中每一帧信号进行相同的处理,故计算复杂度较高;且当前事件检测技术在对音频信号进行突发事件检测的过程中通常是以数帧作为一个检测窗同时进行处理,故对突发事件进行检测的响应延时较长。
发明内容
本发明的目的是提供一种音频事件检测系统及方法,以检测出音频突发事件。
为达到上述目的,本发明采用如下的技术方案:
一种音频事件检测系统,其特征在于,包括:
取样模块,用于取样来自音频输入设备的单声道或多声道的输入信号,得到当前帧的音频信号,并将所获得的当前帧的音频信号分两路输出,一路输出连接音频显著度分析模块,一路输出连接音频信号筛选模块;
音频显著度分析模块,用于提取音频的特征并对取样模块输入的当前帧的音频信号进行显著度分析,得到当前音频信号的显著度,并将当前帧的音频信号的显著度输出给音频信号筛选模块;
音频信号筛选模块,用于根据音频显著度分析模块输入的当前音频信号的显著度,得到需要进一步进行事件匹配的待匹配音频信号和待判音频信号显著度,并相应地分两路输出,一路将待匹配音频信号输出至事件匹配模块,另一路将待判音频信号显著度输出至综合判别模块;
事件匹配模块,用于根据音频信号筛选模块输入的待匹配音频信号,判断待选音频信号是否包含特定的音频事件,输出匹配事件类型和匹配信号似然度,并分别将所得的匹配事件类型、匹配信号似然度分两路输出给综合判别模块;
综合判别模块,用于根据音频信号筛选模块输入的待判音频信号显著度、事件匹配模块输入的匹配事件类型和匹配信号似然度,综合判别后,如果当前音频信号包含突发事件,则输出匹配事件类型和事件判定结果。
一种音频事件检测方法,包括以下步骤:
①由取样模块取样来自音频输入设备的单声道或多声道的输入信号;
②由①所得的第k帧的信号求得第k帧信号的能量Icur,
其中s(n)为当前帧单声道采样信号,N为每一帧的采样点数;
③由②得到第k帧的信号求得第k帧信号的能量Icur,设定一阈值M1,设定另一阈值M2,若Icur<M1,重复步骤①,否则进入步骤④;
④将①中取样所得的第k帧的信号进行音频特征提取,得到第k帧待匹配音频信号的特征矢量
⑤将④得到的第k帧的信号的特征矢量分别与枪声和尖叫声对应的两类GMM计算对数似然度,得到第k帧的信号与枪声GMM匹配的对数似然度sgun,以及与尖叫声GMM匹配的对数似然度sscream;
设定一阈值s,当sgun或sscream大于s时,若sgun>sscream则第k帧的信号匹配为枪声,若sscream>sgun则第k帧的信号匹配为尖叫声;当sgun和sscream都小于s时则第k帧的信号不包含任何音频匹配事件;
⑥若且由⑤得到第k帧的信号不包含任何音频匹配事件,转步骤⑦,否则转步骤⑧;
⑦若由③得到Icur<M2,转步骤①,否则转步骤⑨;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010103634.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:点胶模具和胶水点布装置
- 下一篇:一种定子铁芯浸漆甩干装置