[发明专利]一种基于径向树结构的可视化分析方法在审
申请号: | 202011598530.2 | 申请日: | 2020-12-29 |
公开(公告)号: | CN113779187A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 梁鸿翔;林华;牛中盈 | 申请(专利权)人: | 中国航天科工集团第二研究院 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/31;G06F16/34 |
代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 张然 |
地址: | 100854 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 径向 结构 可视化 分析 方法 | ||
本发明涉及一种基于径向树结构的可视化分析方法,其中,包括:数据处理以及可视化处理;数据处理包括:步骤1:对所分析的每一篇文书,调用文书分割模板,利用正则表达式匹配并分割出基本文书结构,对每部分使用正则表达式匹配、命名实体识别和依存句法分析,提取出每部分对应的三元组,并将三元组以txt文件和json文件的方式进行存储,并以文书案号和罪名作为文件名;步骤2:通过对得到的各篇三元组文件进行正则匹配,提取匹配到读取的每篇文书的关键部分及各部分含有关键信息的三元组;步骤3:提取的部分将采用树形结构重新存储于json文件中,当分析多篇文书时,将各篇文书的关键三元组存储进json文件中;步骤4:生成多文书查询json文件。
技术领域
本发明涉及司法文书管理技术,特别涉及一种基于径向树结构的可视化分析方法。
背景技术
一份结构完整、要素齐全、逻辑严谨的裁判文书,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事审判活动的重要依据。为此,获取裁判文书的关键要素是辅助法律工作者的重要需求。对于裁判文书的关键要素,可以按照涉案人员、司法案件、涉案物品(又简称为“人”、“案”、“物”)三种实体要素进行划分。由于裁判文书中“人案物”的实体元素和关系复杂繁多,为了实现对裁判文书的“人案物”间复杂繁多的关系的梳理,使法律工作者能快速定位和分析到裁判文书中的关键要素,可采用可视化布局,将抽象的文字逻辑转化成更利于查看和理解的图像形式实现的方式对“人案物”的实体和实体间关系进行清晰化展示。
为了实现此种布局,技术中需要实现三元组特征抽取、关键三元组过滤、三元组可视化几部分,以法律文书“人案物”要素的知识图谱并加以可视化实现,从而对文书中的“人”、“案”、“物”进行数据展示和关联分析,以此来解决查看裁判文书中存在的重要信息挖掘成本较大、信息呈现方式单一、信息的理解和分析的时间和人力成本较高的问题。
由于单篇裁判文书中已包含较为丰富和复杂的“人案物”要素和关联关系,因此当根据搜索需求,需要结合多种案由或多篇文书进行分析和对比时,分析和展示的成本将进一步增大,因此需要以合理的方式对多篇文书中不同的“人案物”关系形成的知识图谱进行组合和划分,从而过滤出各篇文书中关键且具有代表性,同时在各类文书中相似且同等重要从而利于对比的关键三元组。
对此,为了在多案由、多文书的情况下能够展示出实体关联,本技术将基于径向树结构实现可视化分析,即对在提取到各篇文书的三元组后,过滤出对分析价值较高的三元组,并结合数据的语义逻辑形成树形数据结构进行分析和管理,从而保证了同一树分支上三元组语义逻辑同类,同一树深度层次上语义逻辑等级相同,并通过径向树布局加以展示。
技术采用的径向树是一种树布局算法,适用于任何类型的逻辑示意图。此布局算法会对逻辑示意图要素进行等级排列,并根据指定的半径参数将它们置于径向树中。在此技术中,逻辑示意图来源于经过数据处理中过滤得到的关键三元组树形结构。径向树布局算法实现可通过从直角坐标系转化为图坐标系的方式进行实现,在设定了一个用作圆心的根交汇点后,将数据结构对应为树结构,并围绕根交汇点为圆心的上圆排列子树进行布局。因此径向树布局算法在保留树的结构的同时,根据树的叶子节点的深度,从常规树结构的水平层数转换为围绕跟交汇点的圆形层数。
通过查阅知识图谱等大规模数据网络可视化的相关文献可知,如何解决大规模数据的图结构难以阅读和分析的问题是研究的热点,主要方式可分为多页面划分、聚类同种类节点或边、对图结构进行约束等。现有的对大规模图结构进行可视化分析的优化布局方式主要集中于处理社群关系、电商平台、电影推荐等领域,对司法领域的研究相对较少。由于单案由的单篇裁判文书进行分析已可以获取一定规模的包含“人案物”实体和实体关系的三元组,因此当案由数量、裁判文书数量增加时,如何凸显各篇文书本身的关键信息和独特性,同时挖掘到各篇文书之间的相同和不同形成对比分析,并转化成利于法律工作者查看和分析的可视化图像成为一个新的难点。
发明内容
本发明的目的在于提供一种基于径向树结构的可视化分析方法,用于解决上述现有技术的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航天科工集团第二研究院,未经中国航天科工集团第二研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011598530.2/2.html,转载请声明来源钻瓜专利网。