[发明专利]面向法院判决文书的多尺度学习的文字识别方法及系统有效
| 申请号: | 202010814088.6 | 申请日: | 2020-08-13 |
| 公开(公告)号: | CN111985464B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 尹义龙;秦者云;袭肖明;王奎奎;黄瑾;周子淇;刘祥飞 | 申请(专利权)人: | 山东大学 |
| 主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/148;G06V30/18;G06V30/19 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李琳 |
| 地址: | 250101 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 面向 法院 判决 文书 尺度 学习 文字 识别 方法 系统 | ||
1.一种面向法院判决文书的多尺度学习的文字识别方法,其特征在于,包括:
获取待识别的法院判决文书图像,提取印章区域;
以目标RGB值差异最大为目标函数,以循环一致性损失为约束条件,基于对抗网络构建印章生成网络模型,采用训练后的印章生成网络模型对印章区域进行印章痕迹RGB值的转换,并删除转换后的印章区域的印章痕迹;
对删除印章痕迹的法院判决文书图像进行特征提取,对得到的特征图分别进行全局目标检测和局部细节检测,将得到的文本候选框的掩码和渐进式掩膜合并后对构建的文本检测模型进行训练,以训练后的文本检测模型得到文字识别结果;
所述印章生成网络模型的损失函数为:
L(GA2B,GB2A,FB,FA)=LCGAN(GA2B,FB,A,B)+LCGAN(GB2A,FA,B,A)+γLcyc(GA2B,GB2A),
其中,GA2B和GB2A为生成器,FA和FB为鉴别器,A和B为图像集合,LCGAN为RGB空间损失约束,Lcyc为循环一致性损失约束;
所述对删除印章痕迹的法院判决文书图像进行特征提取,标注目标框标签和分割标签GroundTruth,目标框标签的标注方法采用传统标注方法;局部细节检测模块需要给一张图像同时标注不同尺度的GroundTruth,具体方式如下:
获取N张不带有印章的法院判决文书图像,对每张图像标记文本框和GroundTruth,对每张图像,设置N个不同尺度的GroundTruth,Gn为最大尺度的GroundTruth,Vatticlipping将Gn裁剪n-1次,每次缩小di个像素得到Gi;
其中,di表示要缩小的像素值,Area(Gi)表示多边形的面积,Perimeter(Gi)表示多边形的周长,ri表示缩小的比例;
其中,m表示最小的缩放比例,是一个超参数,取值范围为(0,1]。
2.如权利要求1所述的面向法院判决文书的多尺度学习的文字识别方法,其特征在于,对法院判决文书图像进行分割,采用深度模型对每个像素块进行判断,获得包含印章痕迹的像素块,将其拼接后得到印章区域。
3.如权利要求1所述的面向法院判决文书的多尺度学习的文字识别方法,其特征在于,所述特征提取采用特征金字塔网络进行特征提取,得到不同通道数的特征图,所述特征金字塔网络包括自底向上路径、自顶向下路径和跳跃连接,所述自底向上路径采用ResNet50网络,自底向上路径的输出作为自顶向下路径的输入,自顶向下路径的输出上采样至自底向上路径,并进行跳跃连接。
4.如权利要求1所述的面向法院判决文书的多尺度学习的文字识别方法,其特征在于,所述全局目标检测包括:获取特征图的特征向量,将特征向量进行通道变化后输入双向LSTM网络中,将双向LSTM网络的输出进行通道变化后,依次经过全连接层和RPN层得到文本候选框。
5.如权利要求1所述的面向法院判决文书的多尺度学习的文字识别方法,其特征在于,所述局部细节检测包括:标记不同尺度的分割标签,将特征图的大小进行归一化处理,依次进行通道合并和卷积处理后,得到不同尺度的渐进式掩膜,每一个渐进式掩膜中,对于同一处文本区域的预测尺度大小不相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010814088.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机电设备研发用振动测试装置
- 下一篇:一种复合板的安装方法





