[发明专利]基于声音识别的监控方法、装置及系统在审
申请号: | 201710944193.X | 申请日: | 2017-09-30 |
公开(公告)号: | CN107527617A | 公开(公告)日: | 2017-12-29 |
发明(设计)人: | 台龙飞;曹瑞林;林伟 | 申请(专利权)人: | 上海应用技术大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/08;G10L15/06;G10L25/63;G10L25/48;H04N7/18 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 胡晶 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 声音 识别 监控 方法 装置 系统 | ||
1.一种基于声音识别的监控方法,其特征在于,包括以下步骤:
S1:进行预先采集若干种特定声音进行声音模型训练,得到训练后的声音模型;
S2:采集现场声音,对采集的声音进行与所述若干种特定声音对应的特征提取;
S3:将提取的特征与所述声音模型进行匹配分类,得到现场声音的分类结果;
S4:根据所述分类结果判断是否需要报警。
2.根据权利要求1所述的基于声音识别的监控方法,其特征在于,所述特定声音包括非语音的异常声音、带情感的语音以及敏感词语音,相应地,所述步骤S2中提取特征时,提取的特征分别为:针对异常声音监控的非语音声音特征;针对人群情绪监控的人群语音情感特征;以及针对人群话语所带敏感词汇监控而提取的语音转文字所需的特征。
3.根据权利要求2所述的基于声音识别的监控方法,其特征在于,当提取非语音声音特征时,采用基于D-ESMD的异常声音特征提取方法,具体包括以下步骤:
①设定T分布随机噪声的次数K;
②采集现场的声音信号s,并将T分布随机噪声添加至所述声音信号s中,得到加噪信号Si,其中,i为加噪信号的个数;
③对所述加噪信号Si利用对称中点插值的ESMD的方法进行分解,得到模态分量
④计算所述模态分量的排列熵值H,并通过现场试验确定阈值;
⑤若所述排列熵值H大于所述阈值,则所述模态分量为有用信号模态分量,进入步骤⑥,否则所述模态分量为噪声;
⑥将作为输入信号,重复③~⑤,直到分解得到的n阶模态分量为噪声为止,其中,n为正整数;
⑦如果i<K,则令i=i+1,重复②~⑥,直到i=K为止,得到所有的模态分量,并求其总体平均值将总体平均值作为分解信号的最终模态分量;
⑧计算各阶模态分量相对于原始的声音信号s的能量比,并组合成特征向量进行归一化处理,作为原始信号的特征向量。
4.根据权利要求2所述的基于声音识别的监控方法,其特征在于,当提取人群语音情感特征时,采用基于语音情感识别的特征提取方法,具体为:使用国际语音情感挑战赛中使用的特征集进行特征向量的表示。
5.根据权利要求2所述的基于声音识别的监控方法,其特征在于,当提取语音转文字所需特征时,采用基于Gammatone的语音特征提取方法,具体包括以下步骤:
①采集的现场的声音信号为x(n),对其进行预加重,设预加重系数为α,预加重之后的声音信号为y(n)=x(n)-α*x(n-1),其中,n为现场采集的声音信号的个数;
②对预加重之后的声音信号y(n)进行分帧,帧长为N个采样点,其中,N为2的正整数次幂;
③对预加重之后的声音信号y(n)加汉明窗,加窗后的语音信号S(n)表示为S(n)=y(n)*w(n),其中,w(n)为汉明窗;
④对加窗后的语音信号S(n)进行快速傅里叶变换,得到频域信号X(k)=fft(S(n),N);
⑤对频域信号X(k)取模的平方得到能量谱,然后用Gammatone滤波器组进行滤波处理,得到信号H(k)=fft(h(n),N);
⑥对每个Gammatone滤波器的输出进行对数压缩;
⑦将对数压缩的信号进行离散余弦变换,得到GFLCC;
⑧将经过离散余弦变换得到的特征进行升半正弦倒谱提升,得到最后的特征。
6.根据权利要求2所述的基于声音识别的监控方法,其特征在于,所述非语音的异常声音包括监控场景中的枪声、爆炸声、撞击声、尖叫声中的一种或多种;所述带情感的语音包括具有开心、正常、平静、热闹、愤怒、生气中的一种情感的语音;所述敏感词语音包括出现救命、杀人、打人中一种或多种危险词汇。
7.根据权利要求6所述的基于声音识别的监控方法,其特征在于,当所述分类结果为所述非语音的异常声音时,则所述步骤S4中判断出对应的现场事件为枪击事件、撞击事件、爆炸事件、突发危险事件中的一种或多种,并进行报警提示;
当所述分类结果为带情感的语音时,则所述步骤S4中判断出对应的人群情感出现愤怒、生气的特征时进行报警提示;
当所述分类结果为敏感词语音时,则所述步骤S4中根据所识别到的敏感词进行报警提示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海应用技术大学,未经上海应用技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710944193.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:智能识别方法及机器人
- 下一篇:一种音频文字同步播放系统