[发明专利]基于案例文本的裁判规则知识抽取方法及系统在审
申请号: | 202110860221.6 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113554172A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 陈浩 | 申请(专利权)人: | 北京法意科技有限公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06F16/36;G06F16/35;G06F40/205;G06F40/30;G06Q50/18 |
代理公司: | 北京方韬法业专利代理事务所(普通合伙) 11303 | 代理人: | 党小林 |
地址: | 100000 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 案例 文本 裁判 规则 知识 抽取 方法 系统 | ||
1.一种基于案例文本的裁判规则知识抽取方法,其特征在于,包括:
根据裁判文书的书写规范与文书结构,按诉讼程序的业务标准,将文书由粗到细切分为多层级的文本片,设计文书的切片模型;
根据裁判规则可能出现的切片位置,利用中文本分层切片的成果基础上,采用基于规则和深度学习混合的算法模型,实现对裁判规则所在自然语言片段的切片模型的设计和算法实现;
根据裁判规则的业务特征,设计裁判规则结构模型;
在自有法律术语库基础上,针对法规文本语料、裁判文书文本语料,采用专家词库、基于规则的自举法和混合的模式,构建法律术语库;
利用构建的法律术语库,基于深度学习的关系抽取模型,构建法律术语概念图谱,图谱采用标准的三元组存储;
针对识别为“裁判规则”的裁判规则切片语料,根据裁判规则模型中的不同类型特征,融合法律术语库,采用基于规则和深度学习混合的方法,识别“裁判规则切片”中的法律术语之间的关系,并根据裁判规则结构模型,生成裁判规则切片语料中存在的裁判规则,并记录裁判规则与语料的链接关系;
按照抽取的法律规则的类型,在对应的法律规则结构模型中进行存储。
2.根据权利要求1所述的基于案例文本的裁判规则知识抽取方法,其特征在于,根据裁判文书的书写规范与文书结构,按诉讼程序的业务标准,将文书由粗到细切分为多层级的文本片,设计文书的切片模型,包括:
总结司法文书书写规范和文书结构,将文书各段落按照逻辑关系划分出多层级的文本片,对裁判文书的一级文本片进行分析,包括“文本首部”、“当事人基本信息段”、“案件由来段”、“诉辩信息段”、“案件事实段”、“裁判分析过程段”、“判决结果段”和“文本尾部”;
设计文书切片模型用以存储文书各逻辑段,每个逻辑段包含若干个细切片。根据每个段落所包含的细切片,设计文书切片模型,如图所示,每个细切片内容用字符串类型存储,并以包含的内容给文本片命名,例如“案件事实段”、“证据细切段”,整个切片模型采用树状结构存储。
3.根据权利要求1所述的基于案例文本的裁判规则知识抽取方法,其特征在于,根据裁判规则可能出现的切片位置,利用中文本分层切片的成果基础上,采用基于规则和深度学习混合的算法模型,实现对裁判规则所在自然语言片段的切片模型的设计和算法实现,包括:
总结裁判规则可能出现的目标切片位置,指向“案件事实推理段”、“证据认证段”、“事实争议焦点认定段”、“裁判要旨段”、“法律争议焦点认定段”;
基于裁判规则的业务内涵、所在位置特征、语义特征,采用基于规则的NLP算法模型,实现对案例文本目标切片段落中的裁判规则切片的提取;
对提取的裁判规则切片文本,在案件xml整体模型中,以“裁判规则切片”节点来存储,并同时记录切片的原文位置。
4.根据权利要求1所述的基于案例文本的裁判规则知识抽取方法,其特征在于,根据裁判规则的业务特征,设计裁判规则结构模型,包括:
结合裁判规则的构成要素、裁判规则的强制力属性、规范内容,设计裁判规则的结构模型。
5.根据权利要求4所述的基于案例文本的裁判规则知识抽取方法,其特征在于,结合裁判规则的构成要素、裁判规则的强制力属性、规范内容,设计裁判规则的结构模型,包括:
设计标准裁判规则的结构模型,包括行为条件、行为模式、法律后果三组要素组成,每组要素组分成单因素和多因素两种类,在结构模型上支持两种类型的存储,并且设计多因素情况下因素之间的逻辑类型,行为条件、行为模式、法律后果的要素包括定性要素和定量要素两种类型,定量要素支持定量值和定量值区间两种模式,裁判规则的结构模型中的三组要素,行为条件、行为模式可以缺省其一;
设计非标准裁判规则的结构模型,某一个行为条件、行为模式也可以作为上述结构模型中的法律后果要素,其他行为条件和行为模式作为法律规则结构模型中的两组要素与这一某一个行为条件、行为模式构成一个完整的裁判规则;
设计裁判规则的强制力属性,包括命令性、禁止性、指引性三类;
设计裁判规则的规范内容属性,包括授权性、义务性、权义复合性三类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京法意科技有限公司,未经北京法意科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110860221.6/1.html,转载请声明来源钻瓜专利网。