[发明专利]一种基于知识图谱和文本分类模型的法律条文推荐方法在审
| 申请号: | 202110548315.X | 申请日: | 2021-05-19 |
| 公开(公告)号: | CN113065005A | 公开(公告)日: | 2021-07-02 |
| 发明(设计)人: | 穆宁;陶辉;陈洲;阮祥超;朱丹 | 申请(专利权)人: | 南京烽火星空通信发展有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/284;G06N3/04;G06N3/08;G06Q50/18 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 陆志斌 |
| 地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 知识 图谱 文本 分类 模型 法律条文 推荐 方法 | ||
本发明公开了一种基于知识图谱和文本分类模型的法律条文推荐方法,步骤包括:法律知识图谱构建、训练文本数据预处理、多标签分类模型训练、法律罪名要素识别、法律条文推荐。本发明采用知识图谱存储法律知识,可以详细展示各级罪名的关联,同时能够快速响应查询结果,能够方便的进行知识扩展和更新。采用TextCNN进行多标签文本分类,使用罪名作为分类标签,解决了罪名与法条不是一对一对应关系的问题。针对法律罪名信息的组合多样性,可以不断补充语料进行迭代,扩充法条推荐的广度。
技术领域
本发明公开了一种基于知识图谱和文本分类模型的法律条文推荐方法,涉及知识图谱和NLP技术领域。
背景技术
随着人工智能在各个行业的广泛应用,人工智能结合法律成了一个热门的研究方向。其中比较常见的应用就是法律条文推荐,不仅能够辅助法官进行信息处理,还能为广大群众进行普法,具有明显应用价值。
现有技术中存在一些推荐方法:
1.基于FastText算法的智能法条推荐方法:通过FastText算法针对诈骗罪、抢劫、经济犯罪或离婚纠纷案件类的判决文书(案情描述),将法条作为分类标签,进行多标签文本分类识别,对案件事实进行分析,提供适用的法条推送。
2.基于倒排索引与Seq2Seq模型的法律法规推荐:构建法律法规的全文倒排索引,然后通过seq2seq神经网络模型输出检索文本对应的关键词序列,通过关键词序列在索引库中进行查询对应的法条信息。
现有技术中,方法一用法条作为分类标签,当罪名涉及多个法条的时候,会导致相同样例对应的法条标签增加,增加了模型训练的复杂度。方法二中神经网络模型输出的是最佳关键词序列,类似于分类模型的最佳标签,当检索词涉及多个法条的时候,会存在信息遗漏,同时维护全文索引库的成本相对较高。
发明内容
本发明所要解决的技术问题是:针对现有技术的缺陷,提供一种基于知识图谱和文本分类模型的法律条文推荐方法,全面有效的识别文本中的法律罪名要素,同时快速进行法条的查询推荐。
本发明为解决上述技术问题采用以下技术方案:
一种基于知识图谱和文本分类模型的法律条文推荐方法,所述方法包括如下步骤:
步骤一、法律知识图谱构建;
步骤二、训练文本数据预处理;
步骤三、多分类标签模型训练;
步骤四、法律罪名要素识别;
步骤五、法律条文推荐,根据罪名分类在法律知识图谱中快速找到对应的法律罪名实体和对应的法律条文实体。
作为本发明的进一步优选方案,所述法律知识图谱构建,包括:
101、从法律网站采集所有法律罪名信息和法律条文信息;
102、根据本体定义,将罪名和法条处理成实体和关系;
103、将数据入图库,构建法律知识图谱。
作为本发明的进一步优选方案,所述训练文本数据预处理,包括:
201、数据集构建:选择训练文本,对文本数据进行打标,标签为训练文本数据对应的罪名信息,然后将训练文本数据进行shape转换,shape维度是m*2;所述训练文本包括公开的判决文书、案件摘要或犯罪行为描述;
202、数据清洗分词:对shape中的content数据进行清洗,同时进行中文分词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司,未经南京烽火星空通信发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110548315.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像超分辨方法及装置
- 下一篇:一种金属复合材料生产用分级加料装置





