[发明专利]一种基于深度学习的声音异常检测系统在审
申请号: | 201810810077.3 | 申请日: | 2018-07-23 |
公开(公告)号: | CN109192222A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 刘勇;李雅纯 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G10L25/24;G10L25/18 |
代理公司: | 浙江杭州金通专利事务所有限公司 33100 | 代理人: | 刘晓春 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类模块 检测结果 声音特征 时间声音 提取模块 学习 异常检测模型 后处理模块 异常检测系统 原始声音数据 标注 声音数据 特征表达 特征输入 异常检测 音频特征 语音特征 封装 输出 分类 预测 | ||
一种基于深度学习的声音异常检测系统,包括声音特征提取模块、深度学习分类模块和检测结果后处理模块;声音特征提取模块处理获取的原始声音数据得到相应的音频特征,组合多个极短时间声音片段语音特征获取短时间声音特征表达;深度学习分类模块与声音特征提取模块连接,对原始声音数据进行标注,深度学习分类模块使用标注后的声音数据训练得到深度学习异常检测模型;生成深度学习异常检测模型后,将声音特征提取模块生成的短时间声音特征输入深度学习异常检测模型进行分类;检测结果后处理模块与深度学习分类模块连接,检测结果后处理模块对深度学习分类模块输出的结果进行封装,将短时间声音的检测结果组合共同预测较长时间的异常检测结果。
技术领域
本发明涉及声音异常检测领域,具体的,涉及一种基于深度学习的声音异常检测系统。
背景技术
变电站内设备运行过程中会出现各种各样的声音,可能是运行状态下发出的正常声音,也可能是设备在故障情况下发出的异常声音。电力巡检人员在经过专门的培训后,能够根据设备发出的不同声音判断设备的正常或异常情况。然而,要求电力巡检人员全天24小时对所有的变电站点进行监控是不现实的,而间歇性的巡检无法实时、有效地检测到变电站的异常情况。与此同时,技术的进步推动着变电站监管向自动化、智能化发展。针对这一现象,需要利用智能技术代替人工来检测识别变电站的异常情况。
发明内容
本发明提供了一种基于深度学习的声音异常检测系统,通过深度学习方法有效地监控变电站声音,判断异常情况。本发明采用以下技术方案。
一种基于深度学习的声音异常检测系统,所述系统包括声音特征提取模块、深度学习分类模块和检测结果后处理模块;
所述声音特征提取模块处理获取的原始声音数据得到相应的音频特征,通过滑动窗口获取极短时间声音片段对应的语音特征,组合多个极短时间声音片段语音特征获取短时间声音特征表达;
所述深度学习分类模块与所述声音特征提取模块连接,对所述原始声音数据进行标注,所述深度学习分类模块使用标注后的声音数据训练得到深度学习异常检测模型;生成所述深度学习异常检测模型后,将所述声音特征提取模块生成的短时间声音特征输入所述深度学习异常检测模型进行分类,做出声音正常或声音异常分类判断;
所述检测结果后处理模块与所述深度学习分类模块连接,所述检测结果后处理模块对深度学习分类模块输出的结果进行封装,将短时间声音的检测结果组合共同预测较长时间的异常检测结果。
优选的,所述通过滑动窗口获取极短时间声音片段对应的语音特征进一步包括,利用所述滑动窗口所述原始声音数据的极短时间声音片段,对所述极短时间声音片段进行短时傅里叶变换得到极短时间声音片段的高维频谱特征,对所述高维频谱特征经过梅尔频率倒谱分析获取梅尔频率倒谱系数MFCC,计算所述梅尔频率倒谱系数MFCC的差值得到第一差值ΔMFCC,计算所述第一差值ΔMFCC的差值得到第二差值Δ2MFCC,将所述梅尔频率倒谱系数MFCC、第一差值ΔMFCC和第二差值Δ2MFCC组合得到极短时间声音片段对应的语音特征表达。
优选的,所述滑动窗口的长度为100ms,所述滑动窗口移动的步进为25ms。
优选的,所述极短时间声音片段的时长为100ms,所述短时间声音的时长为1.325s。
优选的,所述深度学习分类模块采用全连接网络训练模型对标注后的声音数据进行训练。
优选的,所述全连接网络为3层全连接网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810810077.3/2.html,转载请声明来源钻瓜专利网。