[发明专利]一种基于图的裁判文书案件相似计算与检索方法及系统有效
申请号: | 201711033582.3 | 申请日: | 2017-10-30 |
公开(公告)号: | CN108038091B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 金耀辉;姜华;李慧;王永坤 | 申请(专利权)人: | 上海思贤信息技术股份有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F16/332 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
地址: | 201207 上海市浦东新区自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 裁判 文书 案件 相似 计算 检索 方法 系统 | ||
本发明公开了一种基于图的裁判文书案件相似计算与检索方法,包括以下主要步骤:1、采集裁判文书;2、识别裁判文书的说理部分;3、解析说理部分的案件要素;4、生成案件事理图谱;5、客户端接收检索信息;6、抽取或映射案件要素;7、匹配计算案件要素事理图谱;8、返回与检索内容相似的案件。同时公开了一种基于图的裁判文书案件相似计算与检索系统,其特征在于,包括裁判文书案件相似计算装置和相似案件文书检索装置。本发明提出的方法和系统充分考虑了裁判文书的专业知识,生成的案件事理图谱以一种压缩但直观的方式表示出了案件的最关键要素和内在逻辑关系,既方便相关人士直观查看案件要点,也可以精确地从文档库中检索相关的案件。
技术领域
本发明涉及本发明涉及数据处理技术领域,尤其涉及裁判文书案件相似计算与检索方法和系统。
背景技术
相似案件检索是利用大数据技术,对公开的裁判文书做挖掘分析,为办案法官、当事人、律师推送直接相关的指导性或参考性的相似案例。精准高效的相似案件检索将极大提高办案质量与效率,让公众感受到公平正义。
现有技术中,通常使用关键词或关键词组合的匹配来检索相似裁判文书,同时结合预设条件如案由、法院名称、审判程序、裁判日期等对检索结果进行过滤。关键词检索如果采用精确匹配,则匹配案件很少;如果采用包含同义词、近义词等的关键词,则可能导致匹配案件过多,搜索精度下降。关键词检索忽略了法律专业领域知识,没有体现司法逻辑。
在中国专利CN106502996A中提出了一种基于词频-单词反比频率(TF-IDF)的语义匹配裁判文书检索方法,通过调整词在文档和整个文本集中的权重来提高检索结果的相关度,优点是非常简单高效。但是缺点也非常明显:它对法律文书这类长文本术语的支持不好,并且重要司法逻辑没有被反映出来,因此检索结果精度不高。
在中国专利CN106933787A中提出了一种计算裁判文书相似度的方法,首先提取每篇文书的判决关键词,然后构造判决关键词向量,最后通过计算向量的相似度得到裁判文书的相似度。该方法仅考虑了裁判文书的判决结果部分,忽略了裁判文书中证据、事实、争议焦点、因果关系、适用法条等关键的司法逻辑部分,因此案件相似度计算和检索很难达到司法实务要求。
在中国专利CN105930473A中提出了一种基于随机森林技术的相似文件检索方法,通过构造案件特征树,采用随机森林技术训练,得到特征权重树,根据查询条件生成两两案件的相似度矩阵。该方法高度依赖于精准的案件特征提取,专利并未涉及,可以看作只是现有案由检索的一种细化。而且在实际案件审判过程中,案件特征往往是交织的,用树的形式很难表达。
因此,本领域的技术人员致力于开发一种基于图的裁判文书案件相似计算、检索方法与系统,从而解决现有方法中忽略法律专业知识和司法逻辑而导致的搜索结果精度低的问题。
发明内容
为解决上述技术问题,本发明提供了一种基于图的裁判文书案件相似计算与检索方法,其主要步骤包括:
步骤1、服务器端采集裁判文书;
步骤2、裁判文书的说理部分识别;
进一步地,识别过程主要阐明针对当事人的诉讼请求,根据认定的案件事实,依照法律规定,明确诉请是否支持、部分支持或不予支持。该说理部分的特征是以“本院认为”或类似短语为开始,以“本院予以支持/不予支持”或类似短语为结束;
步骤3、说理部分的案件要素解析;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海思贤信息技术股份有限公司,未经上海思贤信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711033582.3/2.html,转载请声明来源钻瓜专利网。