[发明专利]文本分类模型的更新训练方法、装置及设备在审
申请号: | 201811192187.4 | 申请日: | 2018-10-12 |
公开(公告)号: | CN109241288A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 许开河;杨坤;王少军;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06F17/27 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本分类模型 样本文本 更新 语义提取 知识点 标注 装置及设备 分类 特征向量 样本数据 标签 人工智能技术 构建 | ||
本公开涉及人工智能技术领域,具体揭示了一种文本分类模型的更新训练方法、装置及设备,文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成语义提取层和分类层的训练,包括:获取新增知识点对应的样本文本以及对样本文本进行标注的标注标签;通过根据样本数据完成训练的语义提取层构建样本文本的特征向量;根据样本文本的特征向量以及样本文本对应的标注标签进行分类层的更新训练,以实现文本分类模型的更新训练。在需要对文本分类模型进行更新训练时,仅进行分类层的更新训练,从而可以大幅缩短文本分类模型更新训练的时间,实现文本分类模型的及时更新。
技术领域
本公开涉及人工智能技术领域,特别涉及一种文本分类模型的更新训练方法、装置及设备。
背景技术
现有客服机器人问答系统中的文本分类模型,在客服机器人的知识库新增新产品相关的知识点或者新增热点问题相关的知识点后,需要对文本分类模型进行重新训练,一般重新训练一个文本分类模型需要很长的时间,从而导致文本分类模型更新不及时,客服机器人无法回答新增知识点相关的问题。
所以由于文本分类模型训练时间长导致文本分类模型更新不及时的问题还有待解决。
发明内容
为了解决相关技术中存在的问题,本公开提供了一种文本分类模型的更新训练方法及装置。
一种文本分类模型的更新训练方法,所述文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练,所述文本分类模型的更新训练方法包括:
获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签;
通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量;
根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练。
一种文本分类模型的更新训练装置,所述文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练,所述文本分类模型的更新训练装置包括:
获取模块,被配置为执行:获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签;
特征向量构建模块,被配置为执行:通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量;
更新训练模块,被配置为执行:根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练。
在一实施例中,所述特征向量构建模块包括:
分词单元,被配置为执行:通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词;
特征向量构建单元,被配置为执行:根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。
在一实施例中,所述装置还包括:
分类标签补充模块,被配置为执行:根据所述样本文本对应的标注标签补充所述分类层的分类标签;
分类标签集合更新模块,被配置为执行:根据所补充的分类标签更新所述分类层的分类标签集合。
在一实施例中,所述更新训练模块包括:
分类标签预测单元,被配置为执行:利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签;
判断单元,被配置为执行:进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811192187.4/2.html,转载请声明来源钻瓜专利网。