[发明专利]判决文书调取方法、装置、服务器及存储介质在审
| 申请号: | 201910481751.2 | 申请日: | 2019-06-04 |
| 公开(公告)号: | CN110209721A | 公开(公告)日: | 2019-09-06 |
| 发明(设计)人: | 张涛;姚新;袁博 | 申请(专利权)人: | 南方科技大学 |
| 主分类号: | G06F16/25 | 分类号: | G06F16/25;G06Q50/18 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 518000 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 抽取 判决 原始数据 存储介质 目标特征 服务器 管理和使用 文书调取 文书数据 文书信息 预设结构 便利 | ||
本发明公开了一种判决文书的抽取方法、装置、服务器及存储介质。该方法包括获取判决文书的原始数据,确定所述原始数据的待抽取项;对于任一项所述待抽取项,确定所述待抽取项的抽取策略;基于所述抽取策略,根据所述原始数据确定所述待抽取项的目标特征;根据各个待抽取项及各个待抽取项的目标特征生成预设结构的判决文书数据。本发明实施例的技术方案达到了准确、高效抽取判决文书信息的效果,为判决文书的管理和使用提供了便利。
技术领域
本发明实施例涉及技术领域数据处理领域,尤其涉及一种判决文书调取方法、装置、服务器及存储介质。
背景技术
随着我国司法数据公开的推进,越来越多的司法案件判决信息以网页的形式发布出来供公众查询使用。互联网上有公开的判决文书的网站众多,其中,中国判决文书网共计有裁判文书4529万份;Openlaw判决书网共计有裁判文书4731万份,北京无讼网共计有裁判文书5248万份。
互联网上不同网站所公开的判决文书的格式也有所不同,如果需要利用这些公开的判决文书信息,就需要对案件的各个核心字段进行结构化处理,这通常由人工操作来完成。面对如此庞大的案件信息数量,人工处理方式显然在效率上显得非常低下。
发明内容
本发明实施例提供了一种判决文书的抽取方法、装置、服务器及存储介质,以实现判决文书的内容抽取及将自由格式的判决文书转换为结构化的判决文书,抽取方法根据数据特点进行针对性抽取,抽取效率高、适用性更广泛。
第一方面,本发明实施例提供了一种判决文书的抽取方法,该判决文书的抽取方法,包括:
获取判决文书的原始数据,确定所述原始数据的待抽取项;
对于任一项所述待抽取项,确定所述待抽取项的抽取策略;
基于所述抽取策略,根据所述原始数据确定所述待抽取项的目标特征;
根据各个待抽取项的目标特征生成预设结构的判决文书数据。
第二方面,本发明实施例提供了一种判决文书的抽取装置,该判决文书的抽取装置,包括:
待抽取项确定模块,用于获取判决文书的原始数据,确定所述原始数据的待抽取项;
抽取策略确定模块,用于对于任一项所述待抽取项,确定所述待抽取项的抽取策略;
目标特征确定模块,用于基于所述抽取策略,根据所述原始数据确定所述待抽取项的目标特征;
结构化判决文书生成模块,根据各个待抽取项的目标特征生成预设结构的判决文书数据。
第三方面,本发明实施例提供了一种服务器,该服务器包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的判决文书的抽取方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本发明任意实施例所提供的判决文书的抽取方法。
本发明实施例的技术方案,通过确定判决文书的待抽取项,针对不同类型待抽取项采用不同的抽取策略,准确地抽取判决文书的目标特征,并根据待抽取项和目标特征生成具有设定结构的判决文书,抽取过程实现自动化,抽取方法充分考虑了数据本身的特性,准确度高,为判决文书的管理和使用提供了便利。
附图说明
图1是本发明实施例一中的一种判决文书的抽取方法的流程图;
图2A是本发明实施例二中的一种判决文书的抽取方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方科技大学,未经南方科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910481751.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:榜单数据的管理方法及装置
- 下一篇:一种用于数据交换的数据接口





