[发明专利]一种基于深度学习的争议焦点生成方法在审
| 申请号: | 201910980161.4 | 申请日: | 2019-10-15 |
| 公开(公告)号: | CN110889502A | 公开(公告)日: | 2020-03-17 |
| 发明(设计)人: | 程茜雅;毕胜;漆桂林;陈佳敏 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06K9/62;G06F40/289;G06F16/951;G06Q50/18 |
| 代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
| 地址: | 210096 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 争议 焦点 生成 方法 | ||
本发明涉及一种基于深度学习的争议焦点生成方法,所述方法包括以下步骤:步骤1)从网络中爬取大量裁判文书;步骤2)利用正则表达式方法对裁判文书进行初步的清洗和整理,抽取出裁判文书中的原告诉称和被告辩称,并对每一对原告诉称和被告辩称进行人工标注,将原告诉称和被告辩称以及人工标注的数据集,以1:1:1的比例构建成训练集;步骤3)使用深度学习中的seq2seq文本生成模型和attention模型对所述步骤2)最终得到的训练数据集进行训练后,导出该训练数据集对应的生成器模型;步骤4)对步骤3)中训练得到的文本生成器,利用训练完成的生成器从未标注的原告诉称和被告辩称中生成双方的争议焦点。
技术领域
本发明涉及一种生成方法,具体涉及一种基于深度学习的争议焦点生成方法,属于文本生成技术领域。
背景技术
随着自然语言处理技术和人工智能的发展,自助法律服务系统也渐渐建立并完善起来。譬如,可以根据法律文书中的事实描述来预测控诉罪名,实现辅助判决。可以通过查询寻找相关的法律文书;可以为控诉罪名的预测提供合理的法律条文证明。这些工作为法律从业者提供了很大的便利。争议焦点的生成对法官和律师来说具有重要意义。
争议焦点是法官归纳并经过当事人认可的关于证据、事实和法律适用争议的关键问题,既是庭审的主要内容,也是制作裁判文书的主线,方便组织证据认定、事实认定和说理部分的论述。争议焦点生成的意义如下所示:
(1)对法官的意义
·划清审判脉络,保障庭审高效有序。
·争议焦点的总结是裁判文书的“中心思想”。
·双方围绕争议焦点所作的陈述与辩论,加上法官依法作出的裁定,就是裁判文书的雏形。
·双方围绕争议焦点作出的举证质证和发表的辩论,构成了决定案件判决结果的基础。
(2)对律师的意义
·提前帮助律师预判庭审走向,准备证据,确定法律适用。
·一定程度上引导庭审方向。
·帮助预测对方的辩论思路,提前做好准备。
法律争议焦点生成工作属于法律服务系统的一部分,随着技术的发展,法律服务系统的功能越来越多样化。早期的法律工作主要应用的是机器学习的文本分类技术。Boella等人在2011年实现了根据法律文书和它的领域标签之间的关系,来确定特定法律文本的相关领域。Liu和Chen在2017年使用了数据挖掘的方法从先例中提取特征,然后使用文本分类器自动对判决情况分类,以实现判决预测。
发明内容
本发明正是针对现有技术中存在的问题,提供一种基于深度学习的争议焦点生成方法,该技术方案对于给定原告诉称和被告辩称,能够自动生成给定的原告诉称和被告辩称的双方的争议焦点的装置,同时,本发明从网络上爬取裁判文书,并对这些裁判文书抽取出原告诉称和被告辩称,抽取出所有的原告诉称和被告辩称,并标注相应的争议焦点,构建出相应的争议焦点生成装置。
为了实现上述目的,本发明的技术方案如下,一种基于深度学习的争议焦点生成方法,所述方法包括以下步骤:
步骤1)从网络中爬取大量裁判文书;
步骤2)利用正则表达式方法对裁判文书进行初步的清洗和整理,抽取出裁判文书中的原告诉称和被告辩称,并对每一对原告诉称和被告辩称进行人工标注,将原告诉称和被告辩称以及人工标注的数据集,以1:1:1的比例构建成训练集;
步骤3)使用深度学习中的seq2seq文本生成模型和attention模型对所述步骤2)最终得到的训练数据集进行训练后,导出该训练数据集对应的生成器模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910980161.4/2.html,转载请声明来源钻瓜专利网。





