[发明专利]一种基于卷积神经网络的管道场景识别方法在审

专利信息
申请号: 202310235167.5 申请日: 2023-03-13
公开(公告)号: CN116230014A 公开(公告)日: 2023-06-06
发明(设计)人: 张建峰;许宁;刘鑫铭;彭波;唐二隆;邓洋;潘圣;钟雄虎;罗娟;蔡润博 申请(专利权)人: 中建五局安装工程有限公司;湖南大学
主分类号: G10L25/51 分类号: G10L25/51;G10L25/30
代理公司: 长沙七源专利代理事务所(普通合伙) 43214 代理人: 张勇;周晓艳
地址: 518118 广东省深圳市坪山区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 卷积 神经网络 管道 场景 识别 方法
【权利要求书】:

1.一种基于卷积神经网络的管道场景识别方法,其特征在于,包括以下步骤:

S1:采集不同场景的多处管道的音频数据,形成场景类别的标签集T=(t1,t2,...,tn),其中,tn代表管道对应的第n种场景;

S2:选取不同标签下的多处管道录制音频数据,形成原始音频文件集D=(d1,d2,...,dn),dn表示第n个原始音频文件;对原始音频文件集D中每个原始音频文件进行特征提取,形成波形图特征集W=(w1,w2,...,wn)作为模型的输入数据集,wn表示第n个场景中管道对应的波形图特征矩阵;对原始音频文件集D中每个原始音频文件,将其独热编码为一个向量,形成概率值集合Y=(y1,y2,...,yn),yn表示第n个场景管道对应的波形图的概率值;

S3:构建识别模型:搭建一个一维卷积神经网络,用于对特征集W进行处理,搭建一个全连接神经网络,用于分类;所述一维卷积神经网络包括输入层、一维卷积层、最大池化层、全局平均池化层、批量标准化层以及Leaky ReLU层;所述全连接神经网络包括输入层、全连接层、Dropout层、批量标准化层、Leaky ReLU层以及Softmax层;

S4:对波形图特征集W和概率值集合Y进行划分,将其中的80%作为训练数据集,其余20%作为评估数据集;选择交叉熵作为损失函数,随机梯度下降作为识别模型训练过程中的优化算法,设置模型的超参数以及预期准确率;通过训练数据集训练识别模型,通过评估数据集评估识别模型;

S5:采集未识别的管道的音频数据并进行特征提取,利用模型对未识别的管道进行识别。

2.根据权利要求1所述的管道场景识别方法,其特征在于,所述步骤S2或步骤S4中特征提取具体包括如下步骤:提取原始音频文件的波形图,利用Dcase-Util工具库中的FeatureExtractor.extract函数,将原始音频文件作为函数输入,输出波形图特征矩阵w。

3.根据权利要求1所述的管道场景识别方法,其特征在于,所述步骤S2中独热编码具体包括如下步骤:构建一维零向量,向量长度等于标签集T的场景数量n;设原始音频文件对应标签集T中的场景类别,令零向量的第k个值等于1,其余值为0,得到经过独热编码后的向量y。

4.根据权利要求1所述的管道场景识别方法,其特征在于,所述步骤S3中一维卷积神经网络的搭建过程如下:依次搭建输入层、第1个一维卷积层、第1个最大池化层、第2个一维卷积层、第2个最大池化层、第3个一维卷积层、第3个最大池化层、第4个一维卷积层、第4个最大池化层以及1个全局平均池化层;在每个一维卷积层输出时利用1个批量标准化层对数据进行归一化处理,利用1个Leaky ReLU层作为激活函数。

5.根据权利要求4所述的管道场景识别方法,其特征在于,所述一维卷积神经网络的结构特征为Conv-BN-ReLU-Pooling结构的四层堆叠,训练阶段的前向传播过程的表达式如下:

其中,表示训练阶段中批量标准化层的输出,xtrain表示训练阶段中批量标准化层的输入,μB表示上一个卷积层输出数值集合B的均值,σB表示一个卷积层输出数值集合B的方差,∈表示为了避免除数为0使用的微小正数,γ表示可学习重构系数参数,β表示可学习重构常数参数;

测试阶段的前向传播过程的表达式如下:

其中,表示评估阶段中批量标准化层的输出,xtest表示表示评估阶段中批量标准化层的输入,μr表示所有的批量的均值的平均值,σr表示每个批量的方差的无偏估计。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中建五局安装工程有限公司;湖南大学,未经中建五局安装工程有限公司;湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310235167.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top