[发明专利]一种汉语法律判决摘要生成方法及系统有效
申请号: | 202110980483.6 | 申请日: | 2021-08-25 |
公开(公告)号: | CN113609840B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 李东晋;彭德中;郑鈜;汪灏 | 申请(专利权)人: | 西华大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/253;G06F40/284;G06N3/0464;G06N3/0442;G06N3/084;G06Q50/18 |
代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 李想 |
地址: | 610039 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汉语 法律 判决 摘要 生成 方法 系统 | ||
1.一种汉语法律判决摘要生成方法,其特征在于,该生成方法包括:
S1:从原始法律判决中提取重要的语句;
S2:根据上述各个语句的语篇结构分别对其进行分词;
S3:根据分词后所获取的关键语句生成抽象摘要,并将抽象摘要融合为法律判决摘要;
在步骤S1中,从输入的原始法律判决中选择具有高度重要性的语句,将原始法律判决中的各个语句设为序列标记任务,依次访问原始法律判决中的每个语句,并用标签1或0分别标记每个语句;
S101:将原始法律判决中的各个语句作为数据集输入,数据集表示为:D=(S1,S2,...,SN),其中,N表示原始法律判决中语句的数量;
S102:将数据集输入至分类层,分类层根据对各个语句的标签对其进行分类获取语句序列;
S103:使用文档级双向Bi-LSTM对语句序列进行编码,得到语句序列的隐藏表示,分别为:d1,d2,....dN;
S104:通过具有S形函数的线性层计算每个语句的重要性分数,计算公式为:
其中,为Sigmoid激活函数,为可学习参数,使输出概率之间的二元交叉熵函数最小化;
基于法律判决书及其摘要是高度结构化的,由以下六个修辞角色组成:法律纠纷类型、原告请求、被告请求、法院观点、法律依据和判决结果;在步骤S2中,根据关键语句的修辞作用来划分。
2.根据权利要求1所述的汉语法律判决摘要生成方法,其特征在于,在步骤S2中,其具体方法为:
S201:以包含所有修辞角色的指示条款作为判断依据,并通过各指示条款分割文档;
S202:自动为文档中每个语句添加一个对应的修辞标签;
S203:通过含有修辞标签的数据来训练Bert-BiLSTM-CRF模型,直至模型训练收敛;
S204:通过训练后的Bert-BiLSTM-CRF模型对原始法律判决自动拆分为六个修辞角色;
S205:生成每个修辞角色对应的关键语句,然后用于训练抽象摘要模型。
3.根据权利要求1所述的汉语法律判决摘要生成方法,其特征在于,在步骤S3中,提取的每个修辞角色的关键语句作为抽象摘要模型的输入,并通过抽象摘要模型生成相应的单节摘要;
通过对各个单节摘要进行融合以生成最终的法律判决摘要。
4.一种汉语法律判决摘要生成系统,其特征在于,该系统包括:提取模块、分割模块以及生成模块,所述提取模块、分割模块和生成模块之间通信连接;
所述提取模块用于从原始法律判决中提取重要的语句;
所述分割模块根据提取模块输出的各个语句的语篇结构分别对其进行分词;
所述生成模块根据分词后所获取的关键语句生成抽象摘要,并将抽象摘要融合为法律判决摘要;
所述提取模块还用于从输入的原始法律判决中选择具有高度重要性的语句,将原始法律判决中的各个语句设为序列标记任务,依次访问原始法律判决中的每个语句,并用标签1或0分别标记每个语句;
所述提取模块还用于将原始法律判决中的各个语句作为数据集输入,数据集表示为:D=(S1,S2,...,SN),其中,N表示原始法律判决中语句的数量;
将数据集输入至分类层,分类层根据对各个语句的标签对其进行分类获取语句序列;
使用文档级双向Bi-LSTM对语句序列进行编码,得到语句序列的隐藏表示,分别为:d1,d2,....dN;
通过具有S形函数的线性层计算每个语句的重要性分数,计算公式为:
其中,为Sigmoid激活函数,为可学习参数,使输出概率之间的二元交叉熵函数最小化;
基于法律判决书及其摘要是高度结构化的,由以下六个修辞角色组成:法律纠纷类型、原告请求、被告请求、法院观点、法律依据和判决结果;在步骤S2中,根据关键语句的修辞作用来划分。
5.根据权利要求4所述的汉语法律判决摘要生成系统,其特征在于,所述生成模块包括Unilm模型,Unilm模型基于Transformers,通过三个语言模型目标进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华大学,未经西华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110980483.6/1.html,转载请声明来源钻瓜专利网。