[发明专利]一种基于文本相似度的裁判文书的证据链关系模型构建方法在审
| 申请号: | 201810534766.6 | 申请日: | 2018-05-25 |
| 公开(公告)号: | CN108763485A | 公开(公告)日: | 2018-11-06 |
| 发明(设计)人: | 葛季栋;周业茂;董艺璇;李传艺;庄楚涵;周筱羽;骆斌 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 210093 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 证据链 关系模型 裁判 构建 关键要素 预处理 证据 文本相似度 文本预处理 读取 关联 格式输出 建模工具 模型构建 有效运用 建模 评估 权重 抽取 联结 中文 优化 法院 展示 法律 | ||
本发明是一种基于文本相似度的裁判文书证据链关系模型构建方法,该构建方法的主要步骤包括:(1)针对中文裁判文书进行文本预处理;(2)读取预处理后裁判文书中的证据段与事实段;(3)抽取证据链体及事实的What、Where、Who、When和How Much这五类关键要素;(4)通过计算关键要素联结计算构造证据链关系模型中的证据与证据的关联以及证据与事实的关联完成模型构建;(5)并计算建模后的证据链关系模型中每条证据链的权重;(6)将构建出的模型以Excel表格格式输出;(7)使用证据链建模工具展示生成的证据链关系模型的结构。本发明主要针对中国法律裁判文书说理评估中的证据链关系模型构建任务,根据裁判文书说理的特征和法院文书的结构特点,改善裁判文书预处理方法,优化关键要素提取技术,能够有效运用于评估裁判文书的事实说理水平。
技术领域
本发明涉及一种裁判文书说理分析技术,具体涉及一种基于文本相似度的裁判文书的证据链关系模型构建方法,属于自然语言处理技术领域。
背景技术
一直以来,我国的裁判文书普遍存在着说理不全、说理不透或者根本不说理的问题,法官在书写裁判文书时,重认定而轻说理。统计表明,90%以上的裁判文书在说理过程中仅仅做了对证据的罗列,只有不到10%的裁判文书分析了定案理由。裁判文书说理不够导致司法判决的公信力与说服力不足。当前,国家高度重视裁判文书说理质量,提出裁判文书说理改革。裁判文书说理改革是党的十八届三中、四中全会决定和人民法院四五改革纲要部署的一项重要任务,要积极推动这项改革,切实提高裁判文书说理的正当性和可接受性,为促进司法公正、提升司法公信提供制度保障。为了提高裁判文书说理水平,需要自动化工具对裁判文书说理质量进行评估。
裁判文书的说理技术研究主要基于对证据链的提取与分析,研究遵循法言法语及文书说理的自然语言处理技术,抽取裁判文书说理的相关语段,逆向构建证据链和文书说理逻辑关系,并通过计算机程序绘制可视化的证据链与文书说理逻辑图。对于历史大数据的处理,需要引入Hadoop或Spark等大数据处理技术部署信息抽取算法,保持较高的处理效率。
法律界关于证据链也有着充分的研究。证据的本质属性之一是相关性。与事实无关的证据无证明价值。除极少数直接证据之外,绝大多数证据不可能与事实直接关联,而需要相互排列组合。两个证据之间能够组合,意味着两者达成了稳定牢固的“链接”关系,形成了最基本的“证据链”。上海市人民检察院第二分院法律政策研究室的陈为钢的《刑事证据链研究》是国内对于证据链研究的代表作,他率先提出了证据链的链节、链体、链头和联结点的概念,并且定义了证据之间不同的联结方式。
对信息化裁判文书的处理需要用到自然语言处理技术,自然语言处理是计算机应用的一个分支,是人工智能的一部分,其目的是让计算机“理解”自然语言的内容。早期的自然语言处理算法主要是基于复杂的统计模型,大部分系统必须打造自己的语料库。近期的研究更加关注非监督式学习和半监督学习的算法,这种算法可以从没有人工标注理想结果的语料库中学习,然而非监督或者半监督式算法比监督学习要困难。最近几年,针对自然语言处理的深度学习算法纷纷出炉,并且应用在了自然语言处理的语言模型,语法分析等方面。在文本方面自然语言处理技术主要应用在基于自然语言理解的智能搜索引擎和智能检索、智能机器翻译、自动摘要与文本综合、文本分类与文件整理、智能自动作文系统、自动判卷系统、信息过滤与垃圾邮件处理等领域。
发明内容
本发明是一种基于文本相似度的裁判文书的证据链关系模型构建方法,主要针对中文裁判文书中证据链关系模型构建任务,根据裁判文书说理的特征和法院文书词汇的特点,提出一种裁判文书文本预处理方法,提出一种4W1H关键要素的提取策略,提出一种构造证据链关系模型中联结的方法并提出一种计算证据链权重的算法。实现针对性地改善裁判文书预处理方法,优化关键要素提取技术,提高证据链中联结的计算正确率,使得证据链关系模型构建能有效运用于评估裁判文书的事实说理水平。
本发明公开了一种基于文本相似度的裁判文书的证据链关系模型构建方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810534766.6/2.html,转载请声明来源钻瓜专利网。





