[发明专利]案件处理模型的训练方法、案件文本处理方法及相关装置有效
| 申请号: | 202010610510.6 | 申请日: | 2020-06-29 |
| 公开(公告)号: | CN111737416B | 公开(公告)日: | 2022-08-19 |
| 发明(设计)人: | 熊永福 | 申请(专利权)人: | 重庆紫光华山智安科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/295;G06F40/30 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李莎 |
| 地址: | 400700 重庆市*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 案件 处理 模型 训练 方法 文本 相关 装置 | ||
1.一种案件处理模型的训练方法,其特征在于,所述方法包括:
获取训练样本数据;所述训练样本数据包括案件文本和所述案件文本对应的标注结果,所述标注结果包括所述案件文本所属小类的类别标注结果和所述案件文本中的实体对应的实体标注结果;
将所述训练样本数据输入预先建立的案件处理模型,利用所述案件处理模型的特征抽取层输出文本特征向量;所述文本特征向量包括文本整体语义的特征表示;
将所述文本整体语义的特征表示输入所述案件处理模型的分类层,得到所述案件文本所属小类的类别预测结果;
将所述文本特征向量输入所述案件处理模型的实体抽取层,得到所述案件文本中的实体对应的实体预测结果;
依据所述类别标注结果、实体标注结果、类别预测结果和实体预测结果更新所述案件处理模型的参数,以得到训练后的案件处理模型。
2.根据权利要求1所述的案件处理模型的训练方法,其特征在于,所述文本特征向量还包括所述案件文本中每个文本字符对应的特征表示,所述实体抽取层包括激活层和条件随机场CRF层,所述将所述文本特征向量输入所述案件处理模型的实体抽取层,得到所述案件文本中的实体对应的实体预测结果的步骤包括:
利用所述激活层对所述案件文本中每个文本字符对应的特征表示进行标签分类,得到分类结果;所述分类结果包括每个文本字符对应的特征表示属于不同类别的标签的概率,所述不同类别的标签包括实体的开始部分、实体的非开始部分和非实体部分;
将所述分类结果输入所述CRF层,利用所述CRF层学习到的转移矩阵获得不同标签之间的关联关系,进而得到所述案件文本中的实体对应的实体预测结果;其中,所述转移矩阵中的每个元素表示一个标签转移到另一个标签的概率。
3.根据权利要求2所述的案件处理模型的训练方法,其特征在于,所述将所述分类结果输入所述CRF层的步骤之后,所述方法还包括:
对所述CRF层的学习率进行扩张处理。
4.根据权利要求2所述的案件处理模型的训练方法,其特征在于,所述依据所述类别标注结果、实体标注结果、类别预测结果和实体预测结果更新所述案件处理模型的参数,以得到训练后的案件处理模型的步骤包括:
根据所述类别标注结果和所述类别预测结果计算所述分类层的损失函数;
根据所述实体标注结果和所述实体预测结果计算所述CRF层的损失函数;
将所述分类层的损失函数和所述CRF层的损失函数之和作为所述案件处理模型的损失函数;
根据所述案件处理模型的损失函数更新所述案件处理模型的参数,直到所述案件处理模型收敛;
利用验证样本数据对完成训练的案件处理模型进行测试,选取出具有最优模型参数的案件处理模型,进而得到所述训练后的案件处理模型。
5.根据权利要求4所述的案件处理模型的训练方法,其特征在于,所述分类层的损失函数采用自适应交叉熵损失函数,所述CRF层的损失函数采用离散交叉熵损失函数。
6.根据权利要求1-5任一项所述的案件处理模型的训练方法,其特征在于,所述训练样本数据还包括所述案件文本所属大类的类别信息。
7.一种案件文本处理方法,其特征在于,所述方法包括:
获取待处理案件文本;
将所述待处理案件文本输入利用如权利要求1-6任一项所述的方法训练得到的所述案件处理模型,得到所述案件文本所属小类的类别信息、所述案件文本中的各类实体所在的位置以及各类实体对应的属性类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆紫光华山智安科技有限公司,未经重庆紫光华山智安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010610510.6/1.html,转载请声明来源钻瓜专利网。





