[发明专利]一种法律文书要素解析方法及系统在审
申请号: | 201910695870.8 | 申请日: | 2019-07-30 |
公开(公告)号: | CN112329436A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 戴威 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06Q50/18 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 古利兰 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 法律文书 要素 解析 方法 系统 | ||
本发明提供一种法律文书要素解析方法及系统,该方法为:获取待解析的法律文书。对法律文书进行分句处理,得到多条待解析语句。逐一将待解析语句输入预先建立的要素解析模型进行要素解析,得到法律文书中每条待解析语句包含的要素,其中,要素解析模型由基于样本数据训练语言模型获得。在本方案中,通过海量的法律文书预先训练语言模型得到要素解析模型,将需要解析的法律文书进行分句处理得到多条待解析语句,将每一条待解析语句作为要素解析模型的输入得到每条待解析语句中的要素,从而节约人力成本和时间成本,提高判决的准确性和效率。
技术领域
本发明涉及法律文书处理技术领域,具体涉及一种法律文书要素解析方法及系统。
背景技术
随着现代社会的发展,法律是文明社会发展过程中的产物之一。法律通常是指由社会认可国家确认立法机关制定规范的行为准则,并由国家强制力保证规定当事人权利和义务为内容的,对全体社会成员具有普遍约束力的一种特殊行为规范。当社会成员之间出现纠纷时,由司法机关按照法律进行立案裁定。
在进行法律判决时,目前较为常见的方式为要素式审判。即基于案件信息,将案件中的要素逐一提取出来,最后根据提取出来的案件要素进行法律判决。但是一方面,由于案件信息包含多种信息,人工从多种信息中提取判决所需要的要素通常需要花费大量时间和人力成本。另一方面,由于语言的多样性,对同一个定罪要素通常有多个不同的描述和表达方式,会影响判决的准确性和效率。
发明内容
有鉴于此,本发明实施例提供一种法律文书要素解析方法及系统,以解决现有人工进行要素提取存在的人力成本高、时间成本高、准确性低和效率低等问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开了一种法律文书要素解析方法,所述方法包括:
获取待解析的法律文书;
对所述法律文书进行分句处理,得到多条待解析语句;
逐一将所述待解析语句输入预先建立的要素解析模型进行要素解析,得到所述法律文书中每条所述待解析语句包含的要素,其中,所述要素解析模型由基于样本数据训练语言模型获得,所述语言模型用于根据预设数量的法律文本进行预训练确定所述要素解析模型的初始化模型参数。
优选的,当所述语言模型为BERT模型,所述由基于样本数据训练语言模型获得要素解析模型的过程包括:
对所述样本数据进行文字替换以及句子拼接处理得到第一训练数据,其中,所述样本数据基于对公开的法律文书进行分句处理获得;
将所述第一训练数据作为第一BERT模型的输入,结合预设的第一损失函数和所述样本数据,训练所述第一BERT模型直至所述第一BERT模型收敛;
将收敛后的所述第一BERT模型的模型参数作为第二BERT模型的初始化模型参数;
将第二训练数据作为所述第二BERT模型的输入,结合预设的第二损失函数训练所述第二BERT模型直至所述第二BERT模型收敛,得到所述要素解析模型,其中,所述第二训练数据通过从所述样本数据中选取预设数量的法律文书进行要素标注获得。
优选的,所述将所述第一训练数据作为第一BERT模型的输入,结合预设的第一损失函数和所述样本数据训练所述第一BERT模型直至所述第一BERT模型收敛,包括:
将所述第一训练数据作为所述第一BERT模型的输入,得到对应文字替换位置的文字预测结果,以及得到对应句子拼接位置的句子预测结果;
使用第一子损失函数计算所述文字替换位置的实际文字和所述文字预测结果之间的文字误差,以及使用第二子损失函数计算所述句子拼接位置的实际句子与所述句子预测结果之间的句子误差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910695870.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动驾驶状态的检测方法、装置、系统以及电子设备
- 下一篇:一种相位检测器