[发明专利]一种法律文书自动识别、生成系统及其方法在审
申请号: | 201910696842.8 | 申请日: | 2019-07-30 |
公开(公告)号: | CN110390000A | 公开(公告)日: | 2019-10-29 |
发明(设计)人: | 许敏;朱雅都;徐春林;黄尚强;陈泉吉;黄俊凯;李娟 | 申请(专利权)人: | 同方赛威讯信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06Q50/18 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 李洁 |
地址: | 610000 四川省成都市高*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子源文件 文本信息 业务系统 自动识别 预处理 处理模块 生成模块 生成系统 校验 数据源 录入 法律 导入处理模块 出错概率 辅助人工 工作效率 关键信息 映射关系 校对 抽取 案件 转换 受理 转化 | ||
本发明公开了一种法律文书自动识别、生成系统,包括识别模块、处理模块和生成模块,其中:识别模块,用于将法律文书转化电子源文件并导入处理模块;处理模块,进行预处理,定位关键词并提取文本信息;生成模块,抽取与关键词分别一一对应的数据源,生成预填录界面,校验后,自动填录入业务系统。还公开了一种方法,将法律文书转换成电子源文件;对电子源文件进行预处理,定位关键词并提取文本信息;将文本信息与数据源建立映射关系,生成预填录界面辅助人工校对,校验通过后,填录入与系统对接的业务系统。本发明自动识别、提取案件关键信息,并模拟人的方式将数据自动填录到对接的业务系统中,极大地提高了案件受理的工作效率降低出错概率。
技术领域
本发明涉及数据处理技术领域,具体的说,是一种法律文书自动识别、生成系统及其方法。
背景技术
法律文书一般是司法行政机关等在解决诉讼、非诉案件时使用的文书。现有技术中,一般采用的纸质的法律文书,递交到司法行政机关后,受理案件人员需要对案件进行受理登记,即人工对法律文书进行阅读分析,提取关键信息录入其业务系统。例如,检察院受理一个单人的审查逮捕案件,需要填录的案卡项大约90项;受理多人的审查逮捕案件,每增加一个犯罪嫌疑人,需要填录的案卡项会增加50项。并且由于当前司法行政机关案多人少的现象突出,人工受理案件势必会耗费大量的人力、时间,不仅工作繁琐,而且容易出错。
发明内容
本发明的目的在于提供一种法律文书自动识别、生成系统及其方法,用于解决现有技术中人工受理案件耗费大量的人力、时间,不仅工作繁琐,而且容易出错的问题。
本发明通过下述技术方案解决上述问题:
一种法律文书自动识别、生成系统,包括识别模块、处理模块和生成模块,其中:
识别模块,用于将纸质法律文书转化电子源文件,并将电子源文件导入处理模块;或者直接将电子版本的法律文书导入处理模块;
处理模块,对导入的电子源文件进行预处理,定位关键词并提取文本信息;
生成模块,从对接的业务系统中抽取数据源,所述数据源与所述关键词分别一一对应,并建立所述文本信息与数据源的映射关系,生成预填录界面,通过人工校验和确认后,自动填录入业务系统。
进一步地,所述处理模块包括:
预处理单元,其配置成用于进行文本清洗以及文本格式化;
提取关键词单元,根据对接的业务系统中的提取项模板配置提取关键词,定位关键词的位置,并根据设定的匹配规则提取文本信息。
一种法律文书自动识别、生成方法,包括:
步骤S100:将法律文书转换成能够被选择、复制和检索文字的电子源文件;
步骤S200:对电子源文件进行预处理,定位关键词并提取文本信息;
步骤S300:将所述文本信息与对接的业务系统中的数据源建立映射关系,生成预填录界面辅助人工校验,校验通过后,填录入与系统对接的业务系统。
进一步地,所述步骤S100包括将纸质法律文书经过高拍仪扫描、识别并转换成双层PDF文件,另外Word/WPS/双层PDF文书等电子版法律文书可直接导入处理模块。所述双层PDF文件可选择文字、复制文字以及检索文字。
进一步地,所述预处理包括文本清洗和文本格式化,其中:
文本清洗包括编码转换、去空格、去非法字符、缺失关键词补充修正;
文本格式化包括分块、分段和分句,其中分块是根据文本分块标志进行分块,所述分段是按照段落符号进行划分,所述分句以标点符号作为分隔符号,将句子分成一个个的短句。
进一步地,所述定位关键词并提取文本信息具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同方赛威讯信息技术有限公司,未经同方赛威讯信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910696842.8/2.html,转载请声明来源钻瓜专利网。