[发明专利]基于计算机视觉的桥梁钢结构裂缝精准识别方法在审
申请号: | 201811295283.1 | 申请日: | 2018-11-01 |
公开(公告)号: | CN109408985A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 李顺龙;郭亚朋;徐阳;李惠 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06N3/02 |
代理公司: | 哈尔滨市哈科专利事务所有限责任公司 23101 | 代理人: | 吴振刚 |
地址: | 150090 黑龙江省哈尔滨市南岗*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 计算机视觉 桥梁钢结构 裂缝识别 原始图像 钢箱梁 像素级 图像 裂缝 卷积神经网络 桥梁钢箱梁 准确度 标签标记 裂缝图像 人工标注 神经网络 图像切割 像素级别 颜色表示 颜色提取 原始数据 智能算法 训练集 拼接 自动化 返回 分割 分配 | ||
1.一种基于计算机视觉的桥梁钢结构裂缝精准识别方法,其特征在于,方法包括如下步骤:
步骤一、使用钢箱梁常见部位裂缝图像作为原始数据,进行像素级别的人工标注,获得使用不同颜色表示不同类别的像素级标注图像;
步骤二、将原始图像及标注图像按照一定尺寸进行分割,将标注图像按照不同颜色提取后分配不同数字来做标签标记不同类别,并以数组方式进行存储;
步骤三、将训练集输入至深度全卷积神经网络中进行训练,训练过程中使用的损失函数为Dice相关系数损失函数,优化算法为自适应矩估计优化算法;
步骤四、将待识别的桥梁钢箱梁相关部位图像切割后输入至训练好的神经网络中,得到像素级识别结果后进行拼接返回原始图像尺寸的像素级识别结果。
2.根据权利要求1所述的一种基于计算机视觉的桥梁钢结构裂缝精准识别方法,其特征在于,步骤一具体包括:
步骤一一、使用钢箱梁裂缝病害图像数据库,图像尺寸4000×3000像素以上;
步骤一二、对原始图像使用像素标注工具进行不同种类的标注,以不同颜色覆盖不同种类区域;
步骤一三、将原始图像和标注图像同时进行水平翻转、垂直翻转,或者将原始图像进行BGR三个通道施加10%的干扰,分别得到翻转或干扰后的原始图像及其对应的标注图像。
3.根据权利要求1所述的一种基于计算机视觉的桥梁钢箱梁裂缝像素级精准智能识别方法,其特征在于,步骤三中深度全卷积神经网络的各层的结构为:
L1-0层:输入的宽度为512,深度为3;执行卷积层操作,卷积层操作的宽度为3,数量为32,步距为1,补零为1;
L1-1层:输入的宽度为512,深度为32;执行激活层操作;
L1-2层:输入的宽度为512,深度为32,执行规则化层操作;
L1-3层:输入的宽度为512,深度为32;执行卷积层操作,卷积层操作的宽度为3,数量为32,步距为1,补零为1;
L1-4层:输入的宽度为512,深度为32;执行激活层操作;
L1-5层:输入的宽度为512,深度为32,执行规则化层操作;
L1-6层:输入的宽度为512,深度为32;执行卷积层操作,卷积层操作的宽度为3,数量为32,步距为1,补零为1;
L1-7层:输入的宽度为512,深度为32;执行激活层操作;
L1-8层:输入的宽度为512,深度为32,执行规则化层操作;
L1-9层:输入的宽度为512,深度为32,执行池化层操作;
L2-0层:输入的宽度为256,深度为32;执行卷积层操作,卷积层操作的宽度为3,数量为32,步距为1,补零为1;
L2-1层:输入的宽度为256,深度为32;执行激活层操作;
L2-2层:输入的宽度为256,深度为32,执行规则化层操作;
L2-3层:输入的宽度为256,深度为32;执行卷积层操作,卷积层操作的宽度为3,数量为64,步距为1,补零为1;
L2-4层:输入的宽度为256,深度为64;执行激活层操作;
L2-5层:输入的宽度为256,深度为64,执行规则化层操作;
L2-6层:输入的宽度为256,深度为64;执行卷积层操作,卷积层操作的宽度为3,数量为64,步距为1,补零为1;
L2-7层:输入的宽度为256,深度为64;执行激活层操作;
L2-8层:输入的宽度为256,深度为64,执行规则化层操作;
L2-9层:输入的宽度为256,深度为64,执行池化层操作;
L3-0层:输入的宽度为128,深度为64;执行卷积层操作,卷积层操作的宽度为3,数量为64,步距为1,补零为1;
L3-1层:输入的宽度为128,深度为64;执行激活层操作;
L3-2层:输入的宽度为128,深度为64,执行规则化层操作;
L3-3层:输入的宽度为128,深度为64;执行卷积层操作,卷积层操作的宽度为3,数量为128,步距为1,补零为1;
L3-4层:输入的宽度为128,深度为128;执行激活层操作;
L3-5层:输入的宽度为128,深度为128,执行规则化层操作;
L3-6层:输入的宽度为128,深度为128;执行卷积层操作,卷积层操作的宽度为3,数量为128,步距为1,补零为1;
L3-7层:输入的宽度为128,深度为128;执行激活层操作;
L3-8层:输入的宽度为128,深度为128,执行规则化层操作;
L3-9层:输入的宽度为128,深度为128,执行池化层操作;
L4-0层:输入的宽度为64,深度为128;执行卷积层操作,卷积层操作的宽度为3,数量为128,步距为1,补零为1;
L4-1层:输入的宽度为64,深度为128;执行激活层操作;
L4-2层:输入的宽度为64,深度为128,执行规则化层操作;
L4-3层:输入的宽度为64,深度为128;执行卷积层操作,卷积层操作的宽度为3,数量为256,步距为1,补零为1;
L4-4层:输入的宽度为64,深度为256;执行激活层操作;
L4-5层:输入的宽度为64,深度为256,执行规则化层操作;
L4-6层:输入的宽度为64,深度为256;执行卷积层操作,卷积层操作的宽度为3,数量为256,步距为1,补零为1;
L4-7层:输入的宽度为64,深度为256;执行激活层操作;
L4-8层:输入的宽度为64,深度为256,执行规则化层操作;
L4-9层:输入的宽度为64,深度为256,执行池化层操作;
L5-0层:输入的宽度为32,深度为256;执行卷积层操作,卷积层操作的宽度为3,数量为256,步距为1,补零为1;
L5-1层:输入的宽度为32,深度为256;执行激活层操作;
L5-2层:输入的宽度为32,深度为256,执行规则化层操作;
L5-3层:输入的宽度为32,深度为256;执行卷积层操作,卷积层操作的宽度为3,数量为512,步距为1,补零为1;
L5-4层:输入的宽度为32,深度为512;执行激活层操作;
L5-5层:输入的宽度为32,深度为512,执行规则化层操作;
L5-6层:输入的宽度为32,深度为512;执行卷积层操作,卷积层操作的宽度为3,数量为512,步距为1,补零为1;
L5-7层:输入的宽度为32,深度为512;执行激活层操作;
L5-8层:输入的宽度为32,深度为512,执行规则化层操作;
L5-9层:输入的宽度为32,深度为512,执行池化层操作;
L6-0层:输入的宽度为16,深度为512;执行卷积层操作,卷积层操作的宽度为3,数量为1024,步距为1,补零为1;
L6-1层:输入的宽度为16,深度为1024;执行激活层操作;
L6-2层:输入的宽度为16,深度为1024,执行规则化层操作;
L6-3层:输入的宽度为16,深度为1024;执行卷积层操作,卷积层操作的宽度为3,数量为1024,步距为1,补零为1;
L6-4层:输入的宽度为16,深度为1024;执行激活层操作;
L6-5层:输入的宽度为16,深度为512,执行规则化层操作;
L6-6层:输入的宽度为16,深度为1024;执行卷积层操作,卷积层操作的宽度为3,数量为1024,步距为1,补零为1;
L6-7层:输入的宽度为16,深度为1024;执行激活层操作;
L6-8层:输入的宽度为16,深度为1024,执行规则化层操作;
L7-0层:输入的宽度为32,深度为1536;执行反卷积层操作,卷积层操作的宽度为3,数量为1536,步距为1,补零为1;
L7-1层:输入的宽度为32,深度为1536;执行激活层操作;
L7-2层:输入的宽度为32,深度为1536,执行规则化层操作;
L7-3层:输入的宽度为32,深度为1536;执行卷积层操作,卷积层操作的宽度为3,数量为512,步距为1,补零为1;
L7-4层:输入的宽度为32,深度为512;执行激活层操作;
L7-5层:输入的宽度为32,深度为512,执行规则化层操作;
L7-6层:输入的宽度为32,深度为3;执行卷积层操作,卷积层操作的宽度为3,数量为512,步距为1,补零为1;
L7-7层:输入的宽度为32,深度为512;执行激活层操作;
L7-8层:输入的宽度为32,深度为512,执行规则化层操作;
L8-0层:输入的宽度为64,深度为768;执行反卷积层操作,卷积层操作的宽度为3,数量为768,步距为1,补零为1;
L8-1层:输入的宽度为64,深度为768;执行激活层操作;
L8-2层:输入的宽度为64,深度为768,执行规则化层操作;
L8-3层:输入的宽度为64,深度为768;执行卷积层操作,卷积层操作的宽度为3,数量为256,步距为1,补零为1;
L8-4层:输入的宽度为64,深度为256;执行激活层操作;
L8-5层:输入的宽度为64,深度为256,执行规则化层操作;
L8-6层:输入的宽度为64,深度为256;执行卷积层操作,卷积层操作的宽度为3,数量为256,步距为1,补零为1;
L8-7层:输入的宽度为64,深度为256;执行激活层操作;
L8-8层:输入的宽度为64,深度为256,执行规则化层操作;
L9-0层:输入的宽度为128,深度为384;执行反卷积层操作,卷积层操作的宽度为3,数量为384,步距为1,补零为1;
L9-1层:输入的宽度为128,深度为384;执行激活层操作;
L9-2层:输入的宽度为128,深度为384,执行规则化层操作;
L9-3层:输入的宽度为128,深度为384;执行卷积层操作,卷积层操作的宽度为3,数量为128,步距为1,补零为1;
L9-4层:输入的宽度为128,深度为128;执行激活层操作;
L9-5层:输入的宽度为128,深度为128,执行规则化层操作;
L9-6层:输入的宽度为128,深度为128;执行卷积层操作,卷积层操作的宽度为3,数量为128,步距为1,补零为1;
L9-7层:输入的宽度为128,深度为128;执行激活层操作;
L9-8层:输入的宽度为128,深度为128,执行规则化层操作;
L10-0层:输入的宽度为256,深度为192;执行反卷积层操作,卷积层操作的宽度为3,数量为192,步距为1,补零为1;
L10-1层:输入的宽度为256,深度为192;执行激活层操作;
L10-2层:输入的宽度为256,深度为192,执行规则化层操作;
L10-3层:输入的宽度为256,深度为192;执行卷积层操作,卷积层操作的宽度为3,数量为64,步距为1,补零为1;
L10-4层:输入的宽度为256,深度为64;执行激活层操作;
L10-5层:输入的宽度为256,深度为64,执行规则化层操作;
L10-6层:输入的宽度为256,深度为64;执行卷积层操作,卷积层操作的宽度为3,数量为64,步距为1,补零为1;
L10-7层:输入的宽度为256,深度为64;执行激活层操作;
L10-8层:输入的宽度为256,深度为64,执行规则化层操作;
L11-0层:输入的宽度为512,深度为96;执行反卷积层操作,卷积层操作的宽度为3,数量为96,步距为1,补零为1;
L11-1层:输入的宽度为512,深度为96;执行激活层操作;
L11-2层:输入的宽度为512,深度为96,执行规则化层操作;
L11-3层:输入的宽度为512,深度为96;执行卷积层操作,卷积层操作的宽度为3,数量为32,步距为1,补零为1;
L11-4层:输入的宽度为512,深度为32;执行激活层操作;
L11-5层:输入的宽度为512,深度为32,执行规则化层操作;
L11-6层:输入的宽度为512,深度为32;执行卷积层操作,卷积层操作的宽度为3,数量为32,步距为1,补零为1;
L11-7层:输入的宽度为512,深度为32;执行激活层操作;
L11-8层:输入的宽度为512,深度为32,执行规则化层操作;
L12-0层:输入的宽度为512,深度为32;执行卷积层操作,卷积层操作的宽度为3,数量为4,步距为1,补零为1;
L12-1层:输入的宽度为512,深度为4;执行激活层操作;
L13层:输入的宽度为512,深度为4;执行损失层操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811295283.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种CPS场景建模方法及装置
- 下一篇:一种椭圆波束卡塞格伦天线的设计方法