[发明专利]一种法律文本的量子聚类系统及方法在审
申请号: | 201810283300.3 | 申请日: | 2018-04-02 |
公开(公告)号: | CN108595532A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 蔡政英;张礼娜;周琰;王蕊 | 申请(专利权)人: | 三峡大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/18 |
代理公司: | 宜昌市三峡专利事务所 42103 | 代理人: | 吴思高 |
地址: | 443002*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 法律文本 量子 聚类 挖掘系统 文本 聚类系统 输入系统 量子态 数据库 记录 清洗 预处理 图形化输出 初步处理 叠加特性 聚类分析 输出系统 挖掘结果 文本聚类 相干特性 异常现象 用户决策 波函数 法律 参考 分组 发现 | ||
一种法律文本的量子聚类系统及方法,包括法律文书输入系统、法律文本量子聚类挖掘系统、数据库、法律文书输出系统;有关法律文本通过法律文书输入系统输入并由法律文本量子聚类挖掘系统进行预处理和清洗并存入数据库。再由法律文本量子聚类挖掘系统对完成初步处理和清洗的法律文本进行聚类分析,包括使用量子态波函数描述所处理的法律文本或记录,对所有文本和记录进行分组,并将相似的文本和记录集中于一个聚集中,能够利用量子态函数的叠加特性、相干特性、纠缠特性迅速地处理大量文本,发现任意形状的文本聚类和文本的异常现象和行为,并将量子聚类挖掘结果图形化输出,供用户决策参考。
技术领域
本发明属于法律文本聚类分析领域和量子计算领域,具体涉及一种法律文本的量子聚类系统及方法。
背景技术
在如今飞速发展的互联网时代,互联网在各个领域的运用越来越广泛,全球信息量急剧增加。同样,在法律领域,文本聚类方法作为能够帮助用户快速有效地找到所需信息的方法,它具有广泛的应用。文本聚类目前已经形成了多种门类,如划分方法、层次方法、基于密度的方法、基于的网格方法、知识工程方法、统计学习的方法、智能聚类方法(如人工神经网络、模糊系统和进化算法等),都取得了一定的效果。
但是目前的法律文本的传统聚类方法与系统缺点也是很明显的。首先,传统的聚类方法都没有有效地解决对大规模无序文本的快速计算和处理问题。随着国家法治化建设的全面展开和人们法制观念的增强,法院要处理的案件也与日俱增,司法机关案多人少的形势逾来逾严峻,容易延长办案周期,影响办案质量。单纯地增加人手并不足够应付法律文本所呈现的指数型增长。其次,传统算法难以发现任意形状的聚类。比如基于距离的聚类算法通常只能发现近似球状簇,如何发现任意形状的簇在聚类算法设计中显得尤为重要。不同形状的簇在同一个案件也会导致不同的聚类结果,从而做出不一样的判决。再次,传统类算法处理噪声数据的能力较弱。在现实中,一些数据虽然数量很少,但是对算法结果或审判结果影响很严重,比如关键证据链。由于案件的复杂性、疑难性,传统的聚类算法难免会遗漏掉其中的某些信息,忽视证据的完整性,造成裁判案件偏差,极有可能导致冤假错案的发生,甚至引发社会矛盾和群体性事件。最后,传统的聚类算法可伸缩性较差。对于无序数据库,传统的聚类算法搜索的规模随着数据库规模的增长而成线性增长,在经典算法中需要O(N)时间才能完成整个搜索过程。好的可伸缩性要求聚类算法在不同数据集上均具有很强的鲁棒性,无论对于大数据集还是小数据集均是有效的。
法律是国家维护社会秩序的最基本手段,随着社会的发展,人们更渴望得到及时、公正客观的裁判和处理方案,为了维护法律的稳定和社会群众对法律的信仰,维护社会稳定,这就要求法院和其他机构在适用法律文本时更加准确与恰当。但是,我国目前还没有关于法律文本的量子聚类方法与系统。
发明内容
为了克服上述现有技术的缺陷,本发明提供了一种法律文本的量子聚类系统及方法,通过利用量子聚类的方法来挖掘法律文本中相关的法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本、以及其他相关文本的数据,聚类处理进行细化加工,为司法从业人员提供准确可行的裁判方案。
本发明采取的技术方案为:
一种法律文本的量子聚类系统,包括法律文书输入系统、法律文本量子聚类挖掘系统、数据库、法律文书输出系统。
所述法律文书输入系统安装于司法机关、公安机关、监察机关、仲裁机构;用于将刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、或者个人及单位信息文本输入并存入数据库;
所述法律文本量子聚类挖掘系统安装于司法机关的法律信息管理系统;用于对输入的刑事法律法规文本、民事法律法规文本、行政法律法规文本、案例判例文本、物证文本、书证文本、笔录文本、视听资料文本、电子数据文本、个人及单位信息文本进行初步处理和清洗并存入数据库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三峡大学,未经三峡大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810283300.3/2.html,转载请声明来源钻瓜专利网。