[发明专利]Bert模型训练、分类方法、系统、介质和计算机设备在审
申请号: | 202010064378.3 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111242237A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 王双星;孙德毅;杨鹏飞 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 解婷婷;栗若木 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | bert 模型 训练 分类 方法 系统 介质 计算机 设备 | ||
1.一种Bert模型训练方法,其特征在于,用于进行案件分类,所述方法包括:
预先对标准的案件类别代码进行拓展,得到拓展详类代码;
对Bert模型进行训练,训练时采用所述拓展详类代码对案情文本进行标注。
2.根据权利要求1所述的方法,其特征在于,所述对案件类别代码标准进行拓展,得到拓展详类代码,包括:
在案件类别代码的末尾增加一个或多个拓展位,得到拓展案件类别代码;
对拓展案件类别代码进行拓展,得到拓展详类代码。
3.根据权利要求1所述的方法,其特征在于,所述对标准的案件类别代码进行拓展,得到拓展详类代码,包括:
对案件类别代码中的小类进行拓展,新增小类代码,得到新的案件类别代码,在所述新的案件类别代码的末尾增加一个或多个拓展位,得到拓展案件类别代码;
对拓展案件类别代码进行拓展,得到拓展详类代码。
4.根据权利要求2或3所述的方法,其特征在于,所述在案件类别代码的末尾增加一个或多个拓展位,得到拓展案件类别代码,包括:
在案件类别代码通过补0的方式增加拓展位,得到拓展案件类别代码。
5.根据权利要求1所述的方法,其特征在于,所述采用所述拓展详类代码对案情文本进行标注,包括:
在获取案情文本的同时获取案件类别代码;
提取所述案情文本中的关键字信息,返回所述关键字信息和与所述案件类别代码对应的拓展详类代码以供用户进行标注。
6.一种基于Bert模型的分类方法,其特征在于,所述方法包括:
获取待识别案情文本;
将所述待识别案情文本输入Bert模型,得到拓展详类代码,所述Bert模型为采用权利要求1-5中任一方法训练得到的Bert模型。
7.一种Bert模型训练系统,其特征在于,包括拓展模块和训练模块,其中:
所述拓展模块,用于预先对标准的案件类别代码进行拓展,得到拓展详类代码;
所述训练模块,用于对Bert模型进行训练,训练时采用所述拓展详类代码对案情文本进行标注。
8.一种Bert模型分类系统,其特征在于,所述系统包括获取模块和输出模块,其中:
所述获取模块,用于获取待识别案情文本;
所述输出模块,用于将所述待识别案情文本输入Bert模型,得到拓展详类代码,所述Bert模型为采用权利要求1-5中任一方法训练得到的Bert模型。
9.一种计算机可读存储介质,存储有程序指令,当该程序指令被执行时可实现权利要求1-5任一项或权利要求6所述的方法。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5中任一项或权利要求6所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010064378.3/1.html,转载请声明来源钻瓜专利网。