[发明专利]一种基于卷积神经网络的管道场景识别方法在审
申请号: | 202310235167.5 | 申请日: | 2023-03-13 |
公开(公告)号: | CN116230014A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 张建峰;许宁;刘鑫铭;彭波;唐二隆;邓洋;潘圣;钟雄虎;罗娟;蔡润博 | 申请(专利权)人: | 中建五局安装工程有限公司;湖南大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30 |
代理公司: | 长沙七源专利代理事务所(普通合伙) 43214 | 代理人: | 张勇;周晓艳 |
地址: | 518118 广东省深圳市坪山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 管道 场景 识别 方法 | ||
1.一种基于卷积神经网络的管道场景识别方法,其特征在于,包括以下步骤:
S1:采集不同场景的多处管道的音频数据,形成场景类别的标签集T=(t1,t2,...,tn),其中,tn代表管道对应的第n种场景;
S2:选取不同标签下的多处管道录制音频数据,形成原始音频文件集D=(d1,d2,...,dn),dn表示第n个原始音频文件;对原始音频文件集D中每个原始音频文件进行特征提取,形成波形图特征集W=(w1,w2,...,wn)作为模型的输入数据集,wn表示第n个场景中管道对应的波形图特征矩阵;对原始音频文件集D中每个原始音频文件,将其独热编码为一个向量,形成概率值集合Y=(y1,y2,...,yn),yn表示第n个场景管道对应的波形图的概率值;
S3:构建识别模型:搭建一个一维卷积神经网络,用于对特征集W进行处理,搭建一个全连接神经网络,用于分类;所述一维卷积神经网络包括输入层、一维卷积层、最大池化层、全局平均池化层、批量标准化层以及Leaky ReLU层;所述全连接神经网络包括输入层、全连接层、Dropout层、批量标准化层、Leaky ReLU层以及Softmax层;
S4:对波形图特征集W和概率值集合Y进行划分,将其中的80%作为训练数据集,其余20%作为评估数据集;选择交叉熵作为损失函数,随机梯度下降作为识别模型训练过程中的优化算法,设置模型的超参数以及预期准确率;通过训练数据集训练识别模型,通过评估数据集评估识别模型;
S5:采集未识别的管道的音频数据并进行特征提取,利用模型对未识别的管道进行识别。
2.根据权利要求1所述的管道场景识别方法,其特征在于,所述步骤S2或步骤S4中特征提取具体包括如下步骤:提取原始音频文件的波形图,利用Dcase-Util工具库中的FeatureExtractor.extract函数,将原始音频文件作为函数输入,输出波形图特征矩阵w。
3.根据权利要求1所述的管道场景识别方法,其特征在于,所述步骤S2中独热编码具体包括如下步骤:构建一维零向量,向量长度等于标签集T的场景数量n;设原始音频文件对应标签集T中的场景类别,令零向量的第k个值等于1,其余值为0,得到经过独热编码后的向量y。
4.根据权利要求1所述的管道场景识别方法,其特征在于,所述步骤S3中一维卷积神经网络的搭建过程如下:依次搭建输入层、第1个一维卷积层、第1个最大池化层、第2个一维卷积层、第2个最大池化层、第3个一维卷积层、第3个最大池化层、第4个一维卷积层、第4个最大池化层以及1个全局平均池化层;在每个一维卷积层输出时利用1个批量标准化层对数据进行归一化处理,利用1个Leaky ReLU层作为激活函数。
5.根据权利要求4所述的管道场景识别方法,其特征在于,所述一维卷积神经网络的结构特征为Conv-BN-ReLU-Pooling结构的四层堆叠,训练阶段的前向传播过程的表达式如下:
其中,表示训练阶段中批量标准化层的输出,xtrain表示训练阶段中批量标准化层的输入,μB表示上一个卷积层输出数值集合B的均值,σB表示一个卷积层输出数值集合B的方差,∈表示为了避免除数为0使用的微小正数,γ表示可学习重构系数参数,β表示可学习重构常数参数;
测试阶段的前向传播过程的表达式如下:
其中,表示评估阶段中批量标准化层的输出,xtest表示表示评估阶段中批量标准化层的输入,μr表示所有的批量的均值的平均值,σr表示每个批量的方差的无偏估计。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中建五局安装工程有限公司;湖南大学,未经中建五局安装工程有限公司;湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310235167.5/1.html,转载请声明来源钻瓜专利网。