[发明专利]一种融入辅助知识进行刑期预测的方法在审
申请号: | 202111491204.6 | 申请日: | 2021-12-08 |
公开(公告)号: | CN114239939A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 高天寒;贾启振;董傲霜;赵琪珲 | 申请(专利权)人: | 东北大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06F40/205;G06F16/35;G06N5/02 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融入 辅助 知识 进行 刑期 预测 方法 | ||
本发明公开一种融入辅助知识进行刑期预测的方法,方法首先抽取法律文书样例数据集中事实描述、涉案法条和刑期结果,并针对法律文书样例数据集分布不均匀的问题,对法律文书样例数据集中样例较少的种类进行数据补充;接着将抽取的涉案法条作为辅助知识和事实描述部分进行融合,并根据刑期结果设置预测标签;然后进行数据增强处理,以去除噪音数据;最后搭建ERNIE_DPCNN混合网络模型,对模型进行训练、校验和评估,并实现对刑期的预测。本发明不仅解决了数据集分布不均匀影响刑期预测结果的问题,还提高了刑期预测的便捷性、准确性和高效性。
技术领域
本发明涉及法律文本数据分类技术领域,尤其涉及一种融入辅助知识进行刑期预测的方法。
背景技术
在现有的刑期判定的过程中,法官除了要对复杂繁琐的法律文书进行分析,还要参考以往的相似案件进行判案,导致效率低。这种判定方法不仅要求法官要有丰富的经验知识,其次判断结果往往受一定的主观因素影响。
法律智能属于法律领域新兴的产业,旨在赋予机器阅读理解法律文本并进行分析的能力。法律智能包括但不限于刑期预测、罪名预测、类案匹配、法律智能问答等等场景,有望帮助法官、律师等法律领域相关人士高效地解决法律问题,同时也能帮助非法律领域相关人士了解更多法律知识。近年来随着深度学习技术的不断发展,法律智能产业逐渐崭露头角,获得学术界和产业界的广泛关注。
现有的刑期预测研究工作通常把重点放在模型结构上,忽略对训练数据的处理,因此训练结果难以有较大的提升。此外,现有技术只对事实描述部分进行数据处理,忽视了法条知识对于刑期预测的重要性,其次传统Word2vec(一群用来产生词向量的相关模型)软件生成词向量受训练数据影响,生成词向量效果差,会影响刑期预测任务结果,最后刑期预测不同于其他文本分类任务,由于法律领域的特殊性,针对刑期预测结果给出合理的解释原因十分重要,目前研究工作缺乏对刑期预测结果的解释说明。其次,传统的机器学习算法迁移能力较弱,难以复刻到相似法律领域任务当中。
发明内容
针对上述现有技术的不足,本发明提供一种融入辅助知识进行刑期预测的方法。
为解决上述技术问题,本发明所采取的技术方案是:一种融入辅助知识进行刑期预测的方法,包括如下步骤:
步骤1:获取法律文书样例数据集,使用python语言中的工具包,调用json.loads()方法将法律文书样例数据集中事实描述、涉案法条和刑期结果抽取出来并保存在新文件中;
步骤2:针对法律文书样例数据集分布不均匀的问题,对法律文书样例数据集中样例较少的种类进行数据补充,方法如下:
步骤2.1:从网站下载法律文书数据,并将法律文书数据分为文书头部、指控内容、辩护意见、事实描述、判决内容和文书尾部六个部分;
步骤2.2:设计抽取模板,分别对法律文书数据中的事实描述部分和文书尾部部分进行抽取;
所述抽取模板分为事实描述部分抽取模板和文书尾部部分抽取模板;
所诉事实描述部分抽取模板分为前置模板和后置模板两个部分,中间用正则表达式将两个模板进行拼接,在匹配时同时匹配前置模板和后置模板;
所述文书尾部部分抽取模板仅由前置模板拼接正则表达式而成,在匹配时直接匹配到法律文书末尾。
步骤2.3:将抽取的事实描述部分和文书尾部部分进行融合,组成训练数据,对法律文书样例数据集进行补充操作。
步骤3:将步骤1抽取的涉案法条作为辅助知识和事实描述部分进行融合,实现对补充后的数据集进行辅助知识的融合,过程如下:
步骤3.1:对涉案法条进行截长补短操作,并对事实描述部分进行长度统一操作;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111491204.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理