[发明专利]一种文书自动编目方法在审

专利信息
申请号: 202110513618.8 申请日: 2021-05-11
公开(公告)号: CN113657373A 公开(公告)日: 2021-11-16
发明(设计)人: 魏政;曹瑾;陈国;杨凤玲 申请(专利权)人: 南京航天数智科技有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/00;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 210000 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文书 自动 编目 方法
【权利要求书】:

1.一种文书自动编目方法,其特征在于,包括以下步骤:

S1:扫描文件,把标准文书和非标准文书均进行扫描,生成扫描件;

S2:上传文件,首先在电脑上点击解析文件,然后把S1中的扫描件上传到OCR中;

S3:编目,在上传文书后,针对标准文书,通过OCR进行文本、标题识别后,对于人名、份数发送至自然语言处理模块,进行关键字提炼,最终识别成标准化的文书名称,对于非标准文书,采用目录识别的方式进行编目,在上传文书之后,指定属于上传的目录的图片,点击目录识别将目录的图片信息送至OCR进行文书名和页码的识别;

S4:校正,在识别后,针对不能识别被标记的文字进行校正;

S5:推送,确认识别完成的目录没有问题后,点击推送,至统一业务系统,供工作人员查看。

2.根据权利要求1所述的一种文书自动编目方法,其特征在于,所述S1中标准文书指的是电脑生成打印的文字文书,非标准文书为手写的文书。

3.根据权利要求1所述的一种文书自动编目方法,其特征在于,所述S3中针对非标准文书进行识别目录时,遇到不能识别的文字时进行标记,而非简单的识别出相似的文字。

4.根据权利要求3所述的一种文书自动编目方法,其特征在于,所述S3中标记可以为圆圈、红线、叉号、红色的一种或多种。

5.根据权利要求1所述的一种文书自动编目方法,其特征在于,所述S3中针对上传的目录图片进行分类,然后提取其特征,进行识别。

6.根据权利要求5所述的一种文书自动编目方法,其特征在于,所述S3中OCR识别技术包括了图像输入,图像前处理,预识别,图像切分,特征提取,匹配及模型训练,识别后处理。

7.根据权利要求1所述的一种文书自动编目方法,其特征在于,所述S5中提供导出导入功能,进行相似文书导出导入操作,不需要重复进行编目。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航天数智科技有限公司,未经南京航天数智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110513618.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top