[发明专利]文本分类模型的更新训练方法、装置及设备在审
申请号: | 201811192187.4 | 申请日: | 2018-10-12 |
公开(公告)号: | CN109241288A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 许开河;杨坤;王少军;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06F17/27 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本分类模型 样本文本 更新 语义提取 知识点 标注 装置及设备 分类 特征向量 样本数据 标签 人工智能技术 构建 | ||
1.一种文本分类模型的更新训练方法,所述文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练,其特征在于,包括:
获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签;
通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量;
根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练。
2.根据权利要求1所述的方法,其特征在于,所述通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量,包括:
通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词;
根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练之前,还包括:
根据所述样本文本对应的标注标签补充所述分类层的分类标签;
根据所补充的分类标签更新所述分类层的分类标签集合。
4.根据权利要求3所述的方法,其特征在于,所述根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练,包括:
利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签;
进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断;
如果不一致,调整所述分类层的参数直至所得到的所述分类标签与所述标注标签一致。
5.根据权利要求4所述的方法,其特征在于,所述利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签,包括:
利用所述分类层根据所述特征向量预测得到所述特征向量对应于更新后的所述分类标签集合中每一分类标签的概率;
遍历所述每一分类标签的概率,以最大概率值所对应的分类标签作为所述样本文本对应的分类标签。
6.根据权利要求1所述的方法,其特征在于,根据所述新增样本的特征向量以及所述新增样本对应的标注进行所述分类层的更新训练之后,还包括:
通过更新后的所述文本分类模型对若干测试样本进行分类;
根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度;
如果所述分类精度达到指定精度,结束所述文本分类模型的更新训练。
7.一种文本分类模型的更新训练装置,所述文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练,其特征在于,包括:
获取模块,被配置为执行:获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签;
特征向量构建模块,被配置为执行:通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量;
更新训练模块,被配置为执行:根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练。
8.根据权利要求7所述的装置,其特征在于,所述特征向量构建模块包括:
分词单元,被配置为执行:通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词;
特征向量构建单元,被配置为执行:根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。
9.一种文本分类模型的更新训练设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如权利要求1至6中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811192187.4/1.html,转载请声明来源钻瓜专利网。