[发明专利]一种基于Incep-CapsNet网络的篆文识别方法及系统有效
申请号: | 201810480506.5 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108805223B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 杨帆;于飞;刘鑫 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06K9/68 | 分类号: | G06K9/68 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;李艾华 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 incep capsnet 网络 篆文 识别 方法 系统 | ||
1.一种基于Incep-CapsNet网络的篆文识别方法,其特征在于,包括:
获取篆文图像数据集,并按照字形与字体制作分类标签;
对图像数据集进行预处理与图像增广操作;
通过Incep-CapsNet网络对预处理和图像增广后的篆文图像进行特征提取并识别分类;
通过重构网络对预处理和图像增广后的篆文图像进行重构,作为一种有效的正则化方式;
所述通过Incep-CapsNet网络对预处理和图像增广后的篆文图像进行特征提取并识别分类,包括:
通过Inception结构提取输入的篆文图像的特征,Inception结构单元包括多种不同尺寸的卷积核,将不同尺寸的卷积核和篆文图像卷积提取出具有多种不同感受野大小的特征;并通过新型池化方式Various-AvgPool对Inception单元卷积操作后的图像进行降维;所述Various-AvgPool包括尺寸为1x1的卷积核和若干不同尺寸的平均池化;
将降维后的特征图输入到胶囊网络中,依次通过重组和整合形成具有包括位置、大小、方向和/或变形状态的胶囊;
将降维后的特征图输入到胶囊网络中,依次通过重组和整合形成具有包括位置、大小、方向和/或变形状态的胶囊,具体包括:
a、通过重组,形成1024个16维的第一胶囊层;
b、通过权重矩阵wj将第一胶囊层ui的胶囊数量进行整合,整合得到的矩阵为
其中i的范围为1至16,j的范围为1至500;
接着通过耦合矩阵cj将的胶囊维度进行整合,整合得到的矩阵为sj:
其中,耦合矩阵cj来源于bj:
其中,exp()表示指数函数,n表示分类类别数,bj的初始值为0,之后采取下面公式迭代:
其中,sj经过压缩之后便可得到第二胶囊层vj,所采取的压缩方式如下:
2.根据权利要求1所述的基于Incep-CapsNet网络的篆文识别方法,其特征在于,所述对图像数据集进行预处理与图像增广操作,包括:
预处理:将图像数据集统一成相同大小,然后对数据集进行零归一化和标准化操作,如下:
其中,x*表示经过标准化处理之后的数据集,x表示原始图像数据集,μ表示原有数据集的均值,σ表示原有数据集的标准差;
图像增广操作:对预处理后的图像数据集进行图像增广以扩充数据集;图像增广的方法包括图像随机旋转、左右平移、上下平移、左右翻转、上下翻转和/或缩小放大操作。
3.根据权利要求1所述的基于Incep-CapsNet网络的篆文识别方法,其特征在于,所述通过重构网络对预处理和图像增广后的篆文图像进行重构,包括:
将第二胶囊层中与重构目标无关的胶囊进行遮盖,将未遮盖的胶囊作为原始图像的重构元素通过全连接层重新构造出相同大小的图像,作为一种正则化方式,引导网络提取出重构原始图像的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810480506.5/1.html,转载请声明来源钻瓜专利网。