[发明专利]一种法律文书自动识别、生成系统及其方法在审

专利信息
申请号: 201910696842.8 申请日: 2019-07-30
公开(公告)号: CN110390000A 公开(公告)日: 2019-10-29
发明(设计)人: 许敏;朱雅都;徐春林;黄尚强;陈泉吉;黄俊凯;李娟 申请(专利权)人: 同方赛威讯信息技术有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06Q50/18
代理公司: 四川省成都市天策商标专利事务所 51213 代理人: 李洁
地址: 610000 四川省成都市高*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 电子源文件 文本信息 业务系统 自动识别 预处理 处理模块 生成模块 生成系统 校验 数据源 录入 法律 导入处理模块 出错概率 辅助人工 工作效率 关键信息 映射关系 校对 抽取 案件 转换 受理 转化
【说明书】:

发明公开了一种法律文书自动识别、生成系统,包括识别模块、处理模块和生成模块,其中:识别模块,用于将法律文书转化电子源文件并导入处理模块;处理模块,进行预处理,定位关键词并提取文本信息;生成模块,抽取与关键词分别一一对应的数据源,生成预填录界面,校验后,自动填录入业务系统。还公开了一种方法,将法律文书转换成电子源文件;对电子源文件进行预处理,定位关键词并提取文本信息;将文本信息与数据源建立映射关系,生成预填录界面辅助人工校对,校验通过后,填录入与系统对接的业务系统。本发明自动识别、提取案件关键信息,并模拟人的方式将数据自动填录到对接的业务系统中,极大地提高了案件受理的工作效率降低出错概率。

技术领域

本发明涉及数据处理技术领域,具体的说,是一种法律文书自动识别、生成系统及其方法。

背景技术

法律文书一般是司法行政机关等在解决诉讼、非诉案件时使用的文书。现有技术中,一般采用的纸质的法律文书,递交到司法行政机关后,受理案件人员需要对案件进行受理登记,即人工对法律文书进行阅读分析,提取关键信息录入其业务系统。例如,检察院受理一个单人的审查逮捕案件,需要填录的案卡项大约90项;受理多人的审查逮捕案件,每增加一个犯罪嫌疑人,需要填录的案卡项会增加50项。并且由于当前司法行政机关案多人少的现象突出,人工受理案件势必会耗费大量的人力、时间,不仅工作繁琐,而且容易出错。

发明内容

本发明的目的在于提供一种法律文书自动识别、生成系统及其方法,用于解决现有技术中人工受理案件耗费大量的人力、时间,不仅工作繁琐,而且容易出错的问题。

本发明通过下述技术方案解决上述问题:

一种法律文书自动识别、生成系统,包括识别模块、处理模块和生成模块,其中:

识别模块,用于将纸质法律文书转化电子源文件,并将电子源文件导入处理模块;或者直接将电子版本的法律文书导入处理模块;

处理模块,对导入的电子源文件进行预处理,定位关键词并提取文本信息;

生成模块,从对接的业务系统中抽取数据源,所述数据源与所述关键词分别一一对应,并建立所述文本信息与数据源的映射关系,生成预填录界面,通过人工校验和确认后,自动填录入业务系统。

进一步地,所述处理模块包括:

预处理单元,其配置成用于进行文本清洗以及文本格式化;

提取关键词单元,根据对接的业务系统中的提取项模板配置提取关键词,定位关键词的位置,并根据设定的匹配规则提取文本信息。

一种法律文书自动识别、生成方法,包括:

步骤S100:将法律文书转换成能够被选择、复制和检索文字的电子源文件;

步骤S200:对电子源文件进行预处理,定位关键词并提取文本信息;

步骤S300:将所述文本信息与对接的业务系统中的数据源建立映射关系,生成预填录界面辅助人工校验,校验通过后,填录入与系统对接的业务系统。

进一步地,所述步骤S100包括将纸质法律文书经过高拍仪扫描、识别并转换成双层PDF文件,另外Word/WPS/双层PDF文书等电子版法律文书可直接导入处理模块。所述双层PDF文件可选择文字、复制文字以及检索文字。

进一步地,所述预处理包括文本清洗和文本格式化,其中:

文本清洗包括编码转换、去空格、去非法字符、缺失关键词补充修正;

文本格式化包括分块、分段和分句,其中分块是根据文本分块标志进行分块,所述分段是按照段落符号进行划分,所述分句以标点符号作为分隔符号,将句子分成一个个的短句。

进一步地,所述定位关键词并提取文本信息具体包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同方赛威讯信息技术有限公司,未经同方赛威讯信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910696842.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top