[发明专利]一种基于卷积神经网络的道路声信号分类方法有效
申请号: | 202110199215.0 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112560822B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 谢维;陈俊;郭宏成;刘世宇 | 申请(专利权)人: | 江苏聆世科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 南京鑫之航知识产权代理事务所(特殊普通合伙) 32410 | 代理人: | 姚兰兰 |
地址: | 210032 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 道路 信号 分类 方法 | ||
本发明公开了一种基于卷积神经网络的道路声信号分类方法,步骤1、特征提取,步骤2、数据增强,步骤3、模型训练,步骤4、测试阶段,把待测声音样本使用步骤1的特征提取方法,得到待测声音梅尔能量频谱特征集,将待测声音梅尔能量频谱特征集中的测试样本输入到步骤3中训练好的卷积神经网络模型内,如果识别结果为机动车鸣笛声或非机动车鸣笛声,则通过声源定位和异常声发生时那一帧的图像生成声云图,并将声云图送入YOLOv3模型中计算出离声源中心最近的车辆是机动车还是非机动车。
技术领域
本发明属于声音监测与识别技术领域,具体涉及基于卷积神经网络的道路声信号分类方法。
背景技术
异常声是指某种正常环境下不应该产生的声音,道路交通场景的异常声包括警报声、刹车声、急求车声等,交通道路上的异常声音能够反映出交通事故与紧急情况的发生,通过对交通道路声音的监测,可以及时对异常情况进行反应,当发生异常情况时,通过对异常声音的识别,能够分析出该异常情况的性质,还能通过添加鸣笛声分类,对违法鸣笛行为进行检测;
现有的针对道路交通场景的异常声识别方法都是通过音频对异常声进行识别,对从音频信息上难以完全区分的类别时表现一般,比如无法分辨机动车鸣笛和非机动车鸣笛,需要研发一种道路声信号分类方式来解决现有的问题。
发明内容
本发明的目的在于提供一种基于卷积神经网络的道路声信号分类方法,以解决道路上检测到的异常声无法分辨车辆类型的问题。
为实现上述目的,本发明提供如下技术方案:一种基于卷积神经网络的道路声信号分类方法,包括以下步骤:
步骤1、特征提取包括以下步骤:
S1、从原始音频中提取N个采样点集合成一个帧,并把每一帧代入窗函数;
S2、对每一个短时分析窗,通过FFT得到对应的幅度频谱,取平方得到声音的能量频谱;
S3、将能量频谱通过梅尔滤波器组得到梅尔能量频谱;
S4、再把梅尔能量频谱取log非线性变换,得到梅尔能量频谱特征数据集;
步骤2、数据增强:将梅尔能量频谱特征数据集按8:2的比例分为训练集和测试集;对训练集使用Mixup数据增强方法以提升模型的泛化能力;
所述Mixup数据增强的方式:在训练集数据中随机选取两个特征样本按比例混合以线性插值的方式来构建新的训练样本和标签,使用公式对标签处理,所述公式为:
两个数据对是原始数据集中的训练样本对,其中是一个服从B分布的参数,;其中是参数,计算事件概率的发生,用于计算分布时的均值计算。根据参数的设定,从而根据特定问题设定的大小。
步骤3、模型训练:将训练样本输入卷积神经网络模型中进行监督训练,保存在验证集上表现最好的一个模型;训练时,采用Adam算法进行网络参数的更新,当网络迭代次数达到预设的迭代次数或验证集上的识别精度长时间没有提高时,训练停止把结果保存到训练好的卷积神经网络模型。
步骤4、测试阶段:把待测声音样本使用步骤1的特征提取方法,得到待测声音梅尔能量频谱特征集,将待测声音梅尔能量频谱特征集中的测试样本输入到步骤3中训练好的卷积神经网络模型内,如果识别结果为机动车鸣笛声或非机动车鸣笛声,则通过声源定位和异常声发生时那一帧的图像生成声云图,并将声云图送入YOLOv3模型中计算出离声源中心最近的车辆是机动车还是非机动车。
优选的,所述S1中两相邻帧之间有一段重叠区域,将每一帧代入窗函数以消除各个帧两端可能会造成的信号不连续性;
优选的,所述声源定位技术采用波束形成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏聆世科技有限公司,未经江苏聆世科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110199215.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:子应用部署方法和装置
- 下一篇:一种除油器