[发明专利]一种基于卷积神经网络的道路声信号分类方法有效
申请号: | 202110199215.0 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112560822B | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 谢维;陈俊;郭宏成;刘世宇 | 申请(专利权)人: | 江苏聆世科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 南京鑫之航知识产权代理事务所(特殊普通合伙) 32410 | 代理人: | 姚兰兰 |
地址: | 210032 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 道路 信号 分类 方法 | ||
1.一种基于卷积神经网络的道路声信号分类方法,其特征在于:包括以下步骤:
步骤1、特征提取:从原始音频中提取特征数据,得到梅尔能量频谱特征数据集:
步骤2、数据增强:将梅尔能量频谱特征数据集按8:2的比例分为训练集和测试集;对训练集使用Mixup数据增强方法以提升模型的泛化能力;
所述Mixup数据增强方法的方式:在训练集数据中按一定比例随机选取两个特征样本并用权重混合以线性插值的方式,通过公式对训练样本和标签处理,得到新训练样本特征值和标签,所述公式为:
其中两个数据对是原始数据集中的训练样本对,是一个服从B分布的参数,;
步骤3、模型训练:将步骤2得到的新训练样本特征值和标签送入卷积神经网络模型中进行监督训练,把表现最好的一个模型保存在验证集,训练停止把结果保存到训练好的卷积神经网络模型;
步骤4、测试阶段:把待测声音样本使用步骤1的特征提取方法,得到待测声音梅尔能量频谱特征集,将待测声音的梅尔能量频谱特征输入到步骤3中训练好的卷积神经网络模型内,如果识别结果为机动车鸣笛声或非机动车鸣笛声,则通过声源定位和异常声发生时那一帧的图像生成声云图,并将声云图送入YOLOv3模型中进行目标检测,计算出离声源中心最近的车辆是机动车还是非机动车,如果YOLOv3得到的检测结果是机动车则最终该条样本被划分为机动车类别,如果YOLOv3得到的检测结果是非机动车则最终该条样本被划分为非机动车类别,所述步骤1中特征提取的方法为:
S1、从原始音频中提取N个采样点集合成一个帧,并把每一帧代入窗函数;
S2、上述S1中的每一帧带入窗函数后得到短时分析窗,通过FFT得到对应的幅度频谱,取平方得到声音的能量频谱;
S3、将能量频谱通过梅尔滤波器组得到梅尔能量频谱;
S4、再把梅尔能量频谱取log非线性变换,得到梅尔能量频谱特征数据集,步骤4中,所述声源定位采用波束形成方法,所述波束形成方法中将阵列中各个传感器所采集到的信号进行滤波、加权叠加后形成波束,扫描整个接收空间,对一个平面的声压分布进行成像可视化。
2.根据权利要求1所述的一种基于卷积神经网络的道路声信号分类方法,其特征在于:所述步骤3中,所述卷积神经网络模型中进行监督训练时,卷积核和权重采用均匀初始化,偏置采用全0初始化,训练时,采用Adam算法进行网络参数的更新,当网络迭代次数达到预设的迭代次数或验证集上的识别精度长时间没有提高时,训练停止把结果保存到训练好的卷积神经网络模型。
3.根据权利要求1所述的一种基于卷积神经网络的道路声信号分类方法,其特征在于:所述窗函数为Hann窗。
4.根据权利要求1所述的一种基于卷积神经网络的道路声信号分类方法,其特征在于:所述步骤2中训练样本对为训练样本和其对应的标签。
5.根据权利要求1所述的一种基于卷积神经网络的道路声信号分类方法,其特征在于:所述卷积神经网络的包括:六个卷积层、四个最大池化层、一个全局平均池化层和三个全连接层。
6.根据权利要求5所述的一种基于卷积神经网络的道路声信号分类方法,其特征在于:所述六个卷积层中前两个卷积层中每个卷积层后都会接一个最大池化层,后四个卷积层中每两个卷积层后都会接一个最大池化层;所述全局平均池化层在卷积池化层和全连接层之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏聆世科技有限公司,未经江苏聆世科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110199215.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:子应用部署方法和装置
- 下一篇:一种除油器