[发明专利]一种汉语法律判决摘要生成方法及系统有效

专利信息
申请号: 202110980483.6 申请日: 2021-08-25
公开(公告)号: CN113609840B 公开(公告)日: 2023-06-16
发明(设计)人: 李东晋;彭德中;郑鈜;汪灏 申请(专利权)人: 西华大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/253;G06F40/284;G06N3/0464;G06N3/0442;G06N3/084;G06Q50/18
代理公司: 成都九鼎天元知识产权代理有限公司 51214 代理人: 李想
地址: 610039 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 汉语 法律 判决 摘要 生成 方法 系统
【说明书】:

发明公开了一种汉语法律判决摘要生成方法及系统,属于法律文书数据处理的技术领域,该生成方法包括:S1:从原始法律判决中提取重要的语句;S2:根据上述各个语句的语篇结构分别对其进行分词;S3:根据分词后所获取的关键语句生成抽象摘要,并将抽象摘要融合为法律判决摘要,以达到解决法律判决存在输入长度长、语篇结构特殊以及显著内容分布均匀的问题,能有效生成汉语法律判决的目的。

技术领域

本发明属于法律文书数据处理的技术领域,具体而言,涉及一种汉语法律判决摘要生成方法及系统。

背景技术

随着互联网上大量的文本内容、新闻、论文、法律文件等各种文档以指数形式增长,自动文本摘要变得越来越重要。人工摘要需要耗费大量的时间、精力和成本,在文本内容庞大的情况下变得不切实际,因此,对各类文本进行一个“降维”处理显得非常必要。

自动文本摘要技术已被应用于中文法律判决文件的自动汇总,该方法利用领域的元素结构,如:新闻文章、电子邮件、科学论文和法律判决。首先,我们提取了近几年来取得巨大成功的高质量的句子以证明其对法律判决的重要性;其次,由于在线提供大量法律判决、句子及其摘要被分为不同的部分,越来越多的人需要能够生成用于自动文本摘要的目标元素对的系统,这将减少繁重和抽象的模型,以总结法律专业人员冗余工作的不同要素,并分别提供可靠的判断;最后,一个完整的总结是指那些不熟悉法律的人,通过结合我们所研究领域的每个元素的总结而产生的。

以往关于文本摘要的研究主要集中在对中文法律判断进行英语语料库和抽取模型的对比实验,因为大数据集方法,只有很少的数据集和结果证明了关键字在中文法律摘要方面的有效性。我们必须指出:当前提出的法律文件范本是不适用的。此外,与新闻文章相比,生成摘要的数量更多,信息损失更少,同时减少了法律文件中的挑战,并降低了计算复杂性。与科学论文相比,一方面,法律判决的规模往往比其他领域更长;另一方面,法律文件具有特殊的话语信息系统网络架构。法律判决摘要的人工结构,其显著内容均匀分布。

上述所存在的这些问题使得法律摘要生成更加耗时,并且很容易在最终摘要中丢失关键元素,关键字为生成更准确的中文摘要、中文法律判决、有限硬件资源的预训练法律判决和模型注释数据至关重要。

发明内容

鉴于此,为了解决现有技术存在的上述问题,本发明的目的在于提供一种汉语法律判决摘要生成方法及系统以达到解决法律判决存在输入长度长、语篇结构特殊以及显著内容分布均匀的问题,能有效生成汉语法律判决的目的。

本发明所采用的技术方案为:一种汉语法律判决摘要生成方法,该生成方法包括:

S1:从原始法律判决中提取重要的语句;

S2:根据上述各个语句的语篇结构分别对其进行分词;

S3:根据分词后所获取的关键语句生成抽象摘要,并将抽象摘要融合为法律判决摘要。

进一步地,在步骤S1中,从输入的原始法律判决中选择具有高度重要性的语句,将原始法律判决中的各个语句设为序列标记任务,依次访问原始法律判决中的每个语句,并用标签1或0分别标记每个语句。

进一步地,S101:将原始法律判决中的各个语句作为数据集输入,数据集表示为:D=(S1,S2,...,SN),其中,N表示原始法律判决中语句的数量;

S102:将数据集输入至分类层,分类层根据对各个语句的标签对其进行分类获取语句序列;

S103:使用文档级双向Bi-LSTM对语句序列进行编码,得到语句序列的隐藏表示,分别为:d1,d2,....dN

S104:通过具有S形函数的线性层计算每个语句的重要性分数,计算公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华大学,未经西华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110980483.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top