[发明专利]一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法在审
申请号: | 202010982932.6 | 申请日: | 2020-09-16 |
公开(公告)号: | CN112132137A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 白茹意 | 申请(专利权)人: | 山西大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 山西五维专利事务所(有限公司) 14105 | 代理人: | 茹牡花 |
地址: | 030006 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 fcn spp focal net 抽象画 图像 正确 方向 识别 方法 | ||
1.一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法,其特征在于:包括以下步骤:
1)旋转并得到不同角度的原画:将所有抽象画图像依次旋转四个方向,分别得到四个不同方向的抽象画,将旋转后的所有抽象画图像用RGB彩色模式进行表示;
2)建立FCN-SPP-Focal Net模型:基于全卷积神经网络FCN(Fully ConvolutionalNetworks)、空间金字塔池化层SPP(Spatial Pyramid Pooling)和Focal损失函数建立FCN-SPP-Focal Net模型;
3)图像训练和预测:将步骤1)中得到的图像放入步骤2)建立的FCN-SPP-Focal Net模型中进行训练和预测;
4)图像分类和识别:将步骤3)中得到的图像分为正确方向和不正确方向两类,然后自动识别抽象画图像的正确方向;
5)识别结果的验证:分别采用不同的性能评价指标对比实验模型,对预测结果进行验证。
2.根据权利要求1所述的一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法,其特征在于:所述步骤1)中图像的四个旋转方向分别为逆时针旋转0°、90°、180°和270°。
3.根据权利要求1所述的一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法,其特征在于:所述步骤2)中建立FCN-SPP-Focal Net模型的具体步骤包括:
2.1)以FCN-SPP-Focal Net以FCN为网络基础框架,选取前5个卷积层,激活函数采用ReLU,卷积层利用滤波器对输入样本进行卷积,得到特征图;
2.2)对步骤2.1)中得到的特征图进行3种不同尺度的池化,取每块的最大值作为池化特征,在第5个卷积层之后有1个金字塔池化层(SPP),池化层对不同尺寸的特征图进行采样,得到同样长度的池化特征;
2.3)FCN-SPP-Focal Net在SPP层之后连接3个全连接层,用于连接所有神经元;
2.4)在步骤2.3)中的最后一个全连接层之后,采用sigmoid激活函数实现二分类;
2.5)基于FCN、SPP和Focal损失函数建立FCN-SPP-Focal Net模型。
4.根据权利要求3所述的一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法,其特征在于:所述步骤2.1)中的5个卷积层分别为:第1个卷积层由96个7×7个卷积核组成,步长为1,padding为‘same’,2×2的最大池化;第2个卷积层由256个5×5个卷积核组,步长为1,padding为‘same’,2×2的最大池化;第3个卷积层由384个3×3的卷积核组成,步长为1,padding为‘same’;第4个卷积层由384个3×3个卷积核组成,步长为1,padding为‘same’,2×2的最大池化;第5个卷积层由256个3×3,步长为1的卷积核组成,padding为‘same’;
所述激活函数ReLU,又称线性整流函数,公式为:
式中:x为函数输入,f(x)为函数输出。
5.根据权利要求3所述的一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法,其特征在于:所述步骤2.2)中的3种不同尺度的池化具体指1×1=1块,2×2=4块,4×4=16块,总共21块,所述第5个卷积层有256个卷积核,所述金字塔池化层(SPP)的池化特征维度为21×256=5376。
6.根据权利要求3所述的一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法,其特征在于:所述步骤2.3)中的3个全连接层的维度分别为4096,4096和1024。
7.根据权利要求3所述的一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法,其特征在于:所述步骤2.4)中的sigmoid激活函数公式为:
式中:z为函数输入,g(z)为函数输出,表示为图像属于某个类的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010982932.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:带狭缝的贴片天线
- 下一篇:多屏幕拼接标牌的数据交互方法