[发明专利]一种基于深度神经网络的电子卷宗标题定位提取与分类方法在审

专利信息
申请号: 201910454209.8 申请日: 2019-05-24
公开(公告)号: CN110929746A 公开(公告)日: 2020-03-27
发明(设计)人: 葛季栋;李传艺;刘宇翔;姚林霞;乔洪波;周筱羽;骆斌 申请(专利权)人: 南京大学
主分类号: G06K9/62 分类号: G06K9/62;G06K9/34;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 210093 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 神经网络 电子 卷宗 标题 定位 提取 分类 方法
【说明书】:

发明公开了一种基于深度神经网络的电子卷宗标题定位提取与分类方法,包括以下步骤:将卷宗图片输入神经网络提取多张多尺寸的特征图,根据输出的特征图计算类别分数以及边框位置,通过多种标题选举算法推选出文书当中的标题位置以及标题类别。本发明目的是为了解决在实际处理电子卷宗过程中,经常需要手动对电子卷宗图像进行分类的情况,从单纯的图像层面而不是通过OCR(光学字符识别)等方式来提取图像的标题,通过图像的特征能够准确获得图像标题的位置及类别,提高了鲁棒性泛用性,提高了图像分类的准确性。

技术领域

本发明涉及一种针对电子卷宗的分类方法,具体涉及一种基于深度神经网络的电子卷宗标题定位提取与分类方法,属于计算机视觉、深度学习领域。

背景技术

为了全力推进电子卷宗随案同步生成工作,促进现代信息技术与法院工作的深度融合,助推“智慧法院”再升级,全国各地各法院所受理的执行案件,大多一律随案同步生成电子卷宗,涵盖了立案、办理、归档、结案全过程。办案人员须实时将办案资料转换成电子文档并生成电子卷宗,确保了整个办案过程在系统中全部留痕;部门负责人、合议庭、分管院领导等相关人员可通过电子卷宗系统在线跟踪案件办理进度、合议评审案件、考核案卷质量,提高了司法智能化管理水平;各级法院可通过电子卷宗系统实现执行案件卷宗的线上移送,提高了法院间协作工作效率;当事人及其诉讼代理人可在省高院提供的设备上自行扫描上传电子诉讼资料,申请查阅、打印案件的相关电子卷宗信息,实时了解跟踪执行案件办理进度,更好地促进司法公开,实现执行监督。

但由于案件和电子卷宗需要人工进行处理,工作人员需要浏览相关类型的信息,其他数据挖掘信息抽取也依赖于特定类型的卷宗图片,需要编目人员对电子资料进行识别拆分,提取文件标题并手工输入文件名,费时又费力。

电子卷宗图片分类的价值正体现在这,一方面对于一份电子卷宗中的各个图片明确标注好类别后方便其他相关人员或是工作人员更快的审查想要浏览的图片,跟踪具体信息检查是否有材料等的遗漏,极大的提高了工作人员在检阅电子卷宗时的效率。另一方面,作为建设“智慧法院”的第一步,由于许多相关的人工智能的后续步骤都极大的依赖分类后的图片再进行额外的信息提取等步骤,而对于成千上万张图片的分类十分消耗人力,对于电子卷宗图片的智能编目标标注为后续步骤提供了极大的便利,节省了大量的时间和人力。

在计算机视觉中,图像分类是一个十分基础的问题,但是在应用在电子卷宗的图像分类时,由于文本类型卷宗图像整体特征大致相同,同时新类型诉讼材料不断出现以及卷宗材料本身可识别性等因素影响,直接针对整体卷宗图像分类的效果并不会特别理想。由此采用计算机视觉中另一个经典的目标检测和识别,针对文本图像进行标题位置的定位和分类。目标检测大体上分为两种类型,一种是two-stage先将感兴趣区域提出随后重新提取感兴趣区域的图像特征进行后续的分类和推论。另一种是当前采用的端到端对于图像整体特征进行提取,利用图像金字塔的形式在特征图缩小的同时在各层输出不同目标框纵横比和大小的预测框。将不同目标大小的预测负担分担到不同的层去完成,同时联合预测标题类型并对标题框长宽进行回归这种多任务的形式也互相作用提高了各自的准确度。在计算过程中由于需要对于许多纵横比极大的长文本框进行预测,所以添加了许多极小纵横比的卷积层,导致对于文本标题文字的特征很容易丢失,仅仅依靠高层特征同时计算文本标题的类型难以取得令人满意的效果,所以需要在预测文本标题的类型时拼接底层特征使得字体特征不会随着网络层级的增加而消失。因此本发明以基础的端到端目标检测深度网络为基础,简化了传统过程中对于电子卷宗进行扫描全局进行OCR识别(Optical CharacterRecognition,光学字符识别)后再进行文本分析提取标题的流水线步骤,着重研究了一种针对电子卷宗标题的定位、提取和分类的方法。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910454209.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top