[发明专利]交通标志识别模型训练方法及系统在审
申请号: | 202110581522.5 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113486711A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 李文举;张干 | 申请(专利权)人: | 上海应用技术大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交通标志 识别 模型 训练 方法 系统 | ||
1.一种交通标志识别模型训练方法,其特征在于,包括如下步骤:
步骤S1:获取交通标志图像以及每一交通标志图像对应的标签,将所述交通标志图像分为训练集和测试集;
步骤S2:获取基于YOLOV5的网络模型,对所述网络模型的参数进行加载和设置;所述网络模型的主干网络采用CSPDarkNet53模块,设置空间金字塔池化模块,将PANet网络作为路径聚合网络;
步骤S3:根据所述训练集和测试集的类别设置所述网络模型的分类损失的系数和超参数;
步骤S4:采用混合精度训练对所述网络模型先进行热身训练,计算分类损失、回归损失以及置信度损失之和并反向传播进行梯度放大;
步骤S5:对热身训练后的网络模型进行学习率衰减,然后通过测试集对网络模型进行测试后保存所述网络模型及训练产生的权重生成交通标志图像模型。
2.根据权利要求1所述的交通标志识别模型训练方法,其特征在于,步骤S1中先将获取的TT100K数据集的格式转化为VOC数据集格式,再将VOC数据集格式的标签转化为YOLO格式的标签集,以获取所述交通标志图像以及每一交通标志图像对应的标签划。
3.根据权利要求1所述的交通标志识别模型训练方法,其特征在于,初次训练时,在步骤S2中检查所述网络模型的配置信息,获取所述网络模型的参数,确定所述训练集和测试集的图片路径,对所述网络模型设置冻结模型层、SGD优化器和学习率衰减方式。
4.根据权利要求2所述的交通标志识别模型训练方法,其特征在于,所述网络模型的参数包括保存权重的路径,轮次,批次,总批次,权重和结果的保存权重。
5.根据权利要求1所述的交通标志识别模型训练方法,其特征在于,在步骤S3包括如下步骤:
步骤S301:获取网络模型的总步长和交通标志图像的分辨率,判断所述总步长和分辨率之间能否整除,当不能整除时调整所述总步长,能够整除时触发步骤S302;
步骤S302:根据所述训练集和测试集的类别设置所述网络模型的分类损失的系数和超参数;
步骤S303:根据所述交通标志图像对应的标签确定对应的权重,其中,该标签下的交通标志图像数越多,则该标签对应的权重越低;
步骤S304:初始化所述网络模型的mAP和result,并设置学习率衰减的轮次和混合精度训练。mAP为每个类别的平均精度,resUlt包括精度、召回率以及平均精度。
6.根据权利要求1所述的交通标志识别模型训练方法,其特征在于,在步骤S4中,通过设置Lciou增加检测框的尺度以及长和宽的损失,以使预测框更符合真实框,Lciou的计算公式如下所示:
其中,IoU为交并比,b、bgt分别代表了预测框和真实框的中心点,ρ为预测框和真实框的中心点的欧式距离,c为能够同时包含预测框和真实框的最小闭包区域的对角线距离;在惩罚项中加入了αv,其中α为权重函数,表达式为:
而v用来比较两个框宽高比的吻合度,定义为
7.根据权利要求1所述的交通标志识别模型训练方法,其特征在于,在步骤S5中,采用余弦退火的策略进行学习率的衰减,表达式为:
其中,ηt为学习率,为最大学习率,为最小学习率,Tcur为重启后的迭代次数,Ti代表的是第i轮的迭代次数。
8.根据权利要求1所述的交通标志识别模型训练方法,其特征在于,在步骤S4中在热身训练时,将bias的学习率从0.1下降到基准学习率lr×lf,网络模型的参数学习率从0增加到lr×lf,其中,lr为学习率,lf为余弦退火的衰减函数。
9.根据权利要求1所述的交通标志识别模型训练方法,其特征在于,在步骤S5中进行学习率衰减时,通过更新EMA(指数平均移动)给予时间序列靠后的训练图像更高的权重,以增加模型鲁棒性。
10.一种交通标志识别模型训练系统,其特征在于,包括如下模块:
图像获取模块,用于获取交通标志图像以及每一交通标志图像对应的标签,将所述交通标志图像分为训练集和测试集;
模型加载模块,用于获取基于YOLOV5的网络模型,对所述网络模型进行加载和设置;
模型设置模块,用于根据所述训练集和测试集的类别设置所述网络模型的分类损失的系数和超参数;
模型热身模块,用于采用混合精度训练对所述网络模型先进行热身训练,计算三种损失之和并反向传播进行梯度放大;
模型生成模块,用于对热身训练后的网络模型进行学习率衰减,然后通过测试集对网络模型进行测试后保存所述网络模型及训练产生的权重生成交通标志图像模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海应用技术大学,未经上海应用技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110581522.5/1.html,转载请声明来源钻瓜专利网。