[发明专利]一种裁判文书的分析方法、装置、计算机设备及存储介质有效
申请号: | 202110716556.0 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113254651B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 许建峰;孙福辉;陈奇伟;崔甲蓉;王晓燕;李晓慧;李俊慧;卓煜;袁琳;刘明胜 | 申请(专利权)人: | 人民法院信息技术服务中心 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06K9/62 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 贾磊;刘飞 |
地址: | 100745 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 裁判 文书 分析 方法 装置 计算机 设备 存储 介质 | ||
1.一种裁判文书的分析方法,其特征在于,所述方法包括:
从待分析裁判文书中获取待分析数据集;
将所述待分析数据集分别输入至通用要素分析模型以及特征要素分析模型;
基于通用要素分析模型确定所述待分析数据集中的通用要素信息,以及基于特征要素分析模型确定所述待分析数据集中的特征要素信息;所述通用要素信息为待分析裁判文书中所包含的基本信息;所述特征要素信息为待分析裁判文书中所包含的特定信息;
基于所述通用要素信息以及特征要素信息输出分析结果;
其中,所述特征要素分析模型的构建方法包括:
将已知裁判文书依据案件类型进行分类并构造每一种案件类型的训练数据集;
将所述训练数据集输入卷积神经网络以输出对应案件类型的特征关键词信息;所述特征关键词信息包括:特征关键词本体以及特征关键词的位置信息;
基于所述特征关键词信息构建所述特征要素分析模型;
其中,所述构造每一种案件类型的训练数据集包括:
获取一种案件类型所对应的已知裁判文书的词语信息,以及所述词语信息对应的位置信息;所述位置信息包括:段落信息以及语句信息;
基于所述段落信息以及语句信息获取该词语信息的二维数组;
将多个二维数组向量化以形成矩阵形式的训练数据集。
2.根据权利要求1所述的一种裁判文书的分析方法,其特征在于,基于特征要素分析模型确定所述待分析数据集中的特征要素信息包括:
根据所述特征要素分析模型得到特征要素的正则表达式;其中,所述特征要素为一组特征关键词信息;
基于所述正则表达式对所述待分析数据集进行识别以获得待分析数据集中的特征要素信息。
3.根据权利要求1所述的一种裁判文书的分析方法,其特征在于,从待分析裁判文书中获取待分析数据集前,所述方法包括:
从待分析裁判文书中提取至少一个关键词信息;
基于所述关键词信息确定所述待分析裁判文书与所述特征要素分析模型是否匹配;
若是,则从待分析裁判文书中获取待分析数据集。
4.根据权利要求3所述的一种裁判文书的分析方法,其特征在于,从待分析裁判文书中提取至少一个关键词信息包括:
通过以下公式获取待分析裁判文书中任意词语信息的关联比重:
其中,表示该词语信息在待分析裁判文书中出现的词频,表示该词语信息在待分析裁判文书中出现的次数,表示待分析裁判文书中的全部词语信息的数量;表示待分析裁判文书的总数,表示待分析裁判文书中出现该词语信息的文书数;
基于所述关联比重确定一个或多个关键词信息。
5.根据权利要求3所述的一种裁判文书的分析方法,其特征在于,基于所述关键词信息确定所述待分析裁判文书与所述特征要素分析模型是否匹配包括:
计算所述关键词信息命中所述特征关键词信息的命中率;
当所述命中率大于预设阈值时,则所述待分析裁判文书与所述特征要素分析模型匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民法院信息技术服务中心,未经人民法院信息技术服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110716556.0/1.html,转载请声明来源钻瓜专利网。