[发明专利]法律文本解析方法、装置、设备和存储介质在审

专利信息
申请号: 202010678425.3 申请日: 2020-07-14
公开(公告)号: CN111898361A 公开(公告)日: 2020-11-06
发明(设计)人: 倪有发;杜向阳 申请(专利权)人: 南京擎盾信息科技有限公司
主分类号: G06F40/205 分类号: G06F40/205;G06F40/30;G06Q50/18
代理公司: 北京卓唐知识产权代理有限公司 11541 代理人: 卜荣丽
地址: 210000 江苏省南京市雨花台*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 法律 文本 解析 方法 装置 设备 存储 介质
【说明书】:

本申请公开了一种法律文本解析方法、装置、设备和存储介质。方法包括获取待解析法律文本;对待解析法律文本中的目标字段进行梳理,得到目标字段分类体系;根据目标字段分类体系,构建目标字段解析图;根据预设规则,针对目标字段构建目标字段规则表达式;利用目标字段规则表达式对目标字段解析图进行遍历解析,得到解析结果。本申请降低了规则的编写难度,提高了规则库的可维护性和实施成本。本申请解决相关技术中利用正则表达式规则来进行法律本文解析,存在正则表达式规则可读性差,无法复用,且维护及实施难度较大的技术问题。

技术领域

本申请涉及计算机技术领域,具体而言,涉及一种法律文本解析方法、装置、设备和存储介质。

背景技术

法律文本泛指一种法律领域的文本,其具有规范性、准确性、严谨性和权威性。法律文本解析就是从法律文本自身和用户需求两个方面对法律领域非结构化或半结构化的法律文本进行结构化的过程。一方面,由于法律文本自身具有规范性、准确性、严谨性和权威性等特点,需要对其进行基础的结构化解析,比如裁判文书的基础信息包括案号、审理程序、案由、裁判日期等,这些基础信息需要进行解析;另一方面,用户往往根据自己的具体业务场景,如非常规司法统计、类案推荐、量刑预测等,提出一些定制的解析需求,从而需要对法律文本进行深度解析。

申请号为201510457976.6的中国专利公开了一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法,利用正则表达式提取履历信息,而由于履历信息属于简单文本,用于提取履历信息的正则表达式规则库数量不大,且不需要专业领域知识,但是对于法律文本的解析,需要法律领域专业知识,使用正则表达式很难构建庞大的法律文本解析规则库。

申请号为201711417342.3的中国专利公开了一种基于深度学习的不规则实体识别方法,通过深度学习模型来自动识别不规则实体,其中实体一般是指人、事、物或抽象的概念等长度较短的文本,这种方法对于法律文本这类较长且重推理的文本,会产生庞大的弱关联关系图,识别准确率会明显降低。

综上,目前对于文本的解析主要有两个方法,一种是编程人员编写少量正则表达式规则来实现本文解析,另一种是基于深度学习,构建类似于命名实体抽取的模型来实现实体及关系抽取。

但是,以上两个方法存在以下问题:

1、法律文本解析需要很强的法律领域专业知识,正则表达式规则面向的是专业编程技术人员,法律专业人员很难正确使用正则表达式规则来描述法律文本的解析规则,并且正则表达式规则可读性差,多个表达式之间无法复用,维护难度大;

2、深度学习语言模型构建语料标注成本高、难度大,适用于短文本的处理,而对于法律文本这种长文本并不适用。

针对相关技术中利用正则表达式规则来进行法律本文解析,存在正则表达式规则可读性差,无法服用,且维护及实施难度较大的问题,目前尚未提出有效的解决方案。

发明内容

本申请的主要目的在于提供一种法律文本解析方法、装置、设备和存储介质,以解决相关技术中利用正则表达式规则来进行法律本文解析,存在正则表达式规则可读性差,无法复用,且维护及实施难度较大的问题。

为了实现上述目的,第一方面,本申请提供了一种法律文本解析方法。

根据本申请的方法包括:

获取待解析法律文本;

对待解析法律文本中的目标字段进行梳理,得到目标字段分类体系;

根据目标字段分类体系,构建目标字段解析图;

根据预设规则,针对目标字段构建目标字段规则表达式;

利用目标字段规则表达式对目标字段解析图进行遍历解析,得到解析结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京擎盾信息科技有限公司,未经南京擎盾信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010678425.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top