[发明专利]一种融合行为词的罪名预测多任务学习方法及其系统在审
| 申请号: | 202310008676.4 | 申请日: | 2023-01-04 |
| 公开(公告)号: | CN116050609A | 公开(公告)日: | 2023-05-02 |
| 发明(设计)人: | 陈艳平;郭晓;秦永彬;黄瑞章 | 申请(专利权)人: | 贵州大学;贵州数文科技有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/18;G06F40/30;G06F16/35;G06N3/042;G06N3/0442;G06N3/045;G06N3/0464;G06N3/048;G06N3/0895 |
| 代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
| 地址: | 550025 贵州省*** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融合 行为 罪名 预测 任务 学习方法 及其 系统 | ||
本发明属于信息抽取领域,具体涉及一种融合行为词的罪名预测多任务学习方法。步骤1:对裁判文书的案件描述,使用BERT预训练得到文本信息的抽象语义表示;步骤2:基于步骤1的文本信息的抽象语义表示,利用BiLSTM获取文本中上下文语义依赖特征;步骤3:基于步骤2的上下文语义依赖特征,识别行为词边界的方式定位其所在文本的位置;步骤4:基于步骤3定位行为词边界,通过组合得到不同边界生成行为词的跨度;步骤5:基于步骤4识别的行为词跨度,通过构建行为词之间的相关性信息预测所属罪名。用以解决现有方法却往往依赖文本特征,忽略了不同案件行为要素的差异性,缺乏对犯罪行为的有效利用以及不同任务之间参数信息无法共享的问题。
技术领域
本发明属于信息抽取领域,具体涉及一种融合行为词的罪名预测多任务学习方法及其系统。
背景技术
近年来随着智慧法院建设的快速发展与裁判文书数据的公开,人工智能技术在司法领域的应用已经成为热点。各级人民法院积极推进互联网、大数据、人工智能与法院司法实践的融合,围绕法律行业的司法智能问答,案情知识图谱构建,相关法条推荐等应用场景的实现正在逐步改变法律服务市场。司法领域的任务与人工智能的结合简化了司法人员的工作流程,为审判员提供法律建议,为法律知识匮乏人群提供法律咨询等。法院在长期的司法实践过程中积累了大量的裁判文书,叙述了当事人情况、案件过程、庭审流程、判决结果等各项影响案件判决的因素。因此,裁判文书中蕴含着重要的案情信息和知识价值,如何高效地从这些专业领域文本数据中抽取有价值的信息,以及如何利用裁判文书中的特殊信息支撑罪名预测等司法任务。从而有效提升辅助审判工作的智能化水平具有重要的研究意义。
早期的罪名预测任务工作一般采用现有的数学模型或统计方法等。通过待测案件与手工构造的规则模板对比。通过将案件文本信息作为输入,然后输出所属罪名的方式取得了一定的成效。但是复杂规则的设立需要耗费大量法律专业人员才能完成。并且语义信息的构建也仅仅停留在浅层的文本分析上。这些方法只有在特定案情和数据下才适用并且模型的预测效果并不理想,其通用性较差,无法在大规模和多样化的数据集上实现罪名预测。此外,大部分的罪名预测任务被认为等同于文本分类任务进行处理。通过案情描述全文语义直接预测所示罪名,往往忽视了文本内容的结构特性,无法充分利用特殊词汇信息,并且内容中的无用信息积累会干扰判别。
近年来,随着深度学习的发展,在法律领域中使用神经网络模型的方法取得了较好的效果。通过引入人工标记的10个有代表性的区分属性,使用神经网络模型结合罪名属性进行预测。或着通过融入罪名关键字信息的神经网络模型进行罪名预测。针对罪名预测与文本分类的内容差异,对案情关键词特殊信息加以利用可以聚焦案件信息,表达核心语义,有效的提升了模型的准确率和泛化能力。但是提取关键字信息采用无监督或者人工标记的方式,无法建立抽取关键字任务和罪名预测任务的关联性。并且罪名中各种词语的重要性和相关程度在不同罪名的判决中往往差异很大。
发明内容
本发明提供一种融合行为词的罪名预测多任务学习方法,用以解决现有方法却往往依赖文本特征,忽略了不同案件行为要素的差异性,缺乏对犯罪行为的有效利用以及不同任务之间参数信息无法共享的问题。
本发明通过以下技术方案实现:
一种融合行为词的罪名预测多任务学习方法,所述罪名预测多任务学习方法具体包括以下步骤:
步骤1:对裁判文书的案件描述,使用BERT预训练得到文本信息的抽象语义表示;
步骤2:基于步骤1的文本信息的抽象语义表示,利用BiLSTM获取文本中上下文语义依赖特征;
步骤3:基于步骤2的上下文语义依赖特征,识别行为词边界的方式定位其所在文本的位置;
步骤4:基于步骤3定位行为词边界,通过组合得到不同边界生成行为词的跨度;
步骤5:基于步骤4识别的行为词跨度,通过构建行为词之间的相关性信息预测所属罪名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学;贵州数文科技有限公司,未经贵州大学;贵州数文科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310008676.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





