[发明专利]一种融入辅助知识进行刑期预测的方法在审

专利信息
申请号: 202111491204.6 申请日: 2021-12-08
公开(公告)号: CN114239939A 公开(公告)日: 2022-03-25
发明(设计)人: 高天寒;贾启振;董傲霜;赵琪珲 申请(专利权)人: 东北大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q50/26;G06F40/205;G06F16/35;G06N5/02
代理公司: 沈阳东大知识产权代理有限公司 21109 代理人: 李在川
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融入 辅助 知识 进行 刑期 预测 方法
【说明书】:

发明公开一种融入辅助知识进行刑期预测的方法,方法首先抽取法律文书样例数据集中事实描述、涉案法条和刑期结果,并针对法律文书样例数据集分布不均匀的问题,对法律文书样例数据集中样例较少的种类进行数据补充;接着将抽取的涉案法条作为辅助知识和事实描述部分进行融合,并根据刑期结果设置预测标签;然后进行数据增强处理,以去除噪音数据;最后搭建ERNIE_DPCNN混合网络模型,对模型进行训练、校验和评估,并实现对刑期的预测。本发明不仅解决了数据集分布不均匀影响刑期预测结果的问题,还提高了刑期预测的便捷性、准确性和高效性。

技术领域

本发明涉及法律文本数据分类技术领域,尤其涉及一种融入辅助知识进行刑期预测的方法。

背景技术

在现有的刑期判定的过程中,法官除了要对复杂繁琐的法律文书进行分析,还要参考以往的相似案件进行判案,导致效率低。这种判定方法不仅要求法官要有丰富的经验知识,其次判断结果往往受一定的主观因素影响。

法律智能属于法律领域新兴的产业,旨在赋予机器阅读理解法律文本并进行分析的能力。法律智能包括但不限于刑期预测、罪名预测、类案匹配、法律智能问答等等场景,有望帮助法官、律师等法律领域相关人士高效地解决法律问题,同时也能帮助非法律领域相关人士了解更多法律知识。近年来随着深度学习技术的不断发展,法律智能产业逐渐崭露头角,获得学术界和产业界的广泛关注。

现有的刑期预测研究工作通常把重点放在模型结构上,忽略对训练数据的处理,因此训练结果难以有较大的提升。此外,现有技术只对事实描述部分进行数据处理,忽视了法条知识对于刑期预测的重要性,其次传统Word2vec(一群用来产生词向量的相关模型)软件生成词向量受训练数据影响,生成词向量效果差,会影响刑期预测任务结果,最后刑期预测不同于其他文本分类任务,由于法律领域的特殊性,针对刑期预测结果给出合理的解释原因十分重要,目前研究工作缺乏对刑期预测结果的解释说明。其次,传统的机器学习算法迁移能力较弱,难以复刻到相似法律领域任务当中。

发明内容

针对上述现有技术的不足,本发明提供一种融入辅助知识进行刑期预测的方法。

为解决上述技术问题,本发明所采取的技术方案是:一种融入辅助知识进行刑期预测的方法,包括如下步骤:

步骤1:获取法律文书样例数据集,使用python语言中的工具包,调用json.loads()方法将法律文书样例数据集中事实描述、涉案法条和刑期结果抽取出来并保存在新文件中;

步骤2:针对法律文书样例数据集分布不均匀的问题,对法律文书样例数据集中样例较少的种类进行数据补充,方法如下:

步骤2.1:从网站下载法律文书数据,并将法律文书数据分为文书头部、指控内容、辩护意见、事实描述、判决内容和文书尾部六个部分;

步骤2.2:设计抽取模板,分别对法律文书数据中的事实描述部分和文书尾部部分进行抽取;

所述抽取模板分为事实描述部分抽取模板和文书尾部部分抽取模板;

所诉事实描述部分抽取模板分为前置模板和后置模板两个部分,中间用正则表达式将两个模板进行拼接,在匹配时同时匹配前置模板和后置模板;

所述文书尾部部分抽取模板仅由前置模板拼接正则表达式而成,在匹配时直接匹配到法律文书末尾。

步骤2.3:将抽取的事实描述部分和文书尾部部分进行融合,组成训练数据,对法律文书样例数据集进行补充操作。

步骤3:将步骤1抽取的涉案法条作为辅助知识和事实描述部分进行融合,实现对补充后的数据集进行辅助知识的融合,过程如下:

步骤3.1:对涉案法条进行截长补短操作,并对事实描述部分进行长度统一操作;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111491204.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top