[发明专利]分类模型的融合方法、装置及存储介质有效
| 申请号: | 202010113360.8 | 申请日: | 2020-02-24 |
| 公开(公告)号: | CN111275133B | 公开(公告)日: | 2023-09-29 |
| 发明(设计)人: | 路泽;肖万鹏;鞠奇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/764;G06V10/82;G06N3/084 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王花丽;张颖玲 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分类 模型 融合 方法 装置 存储 介质 | ||
1.一种文本分类模型的融合方法,其特征在于,所述方法包括:
通过第一文本分类模型对第二训练样本进行第一类别的分类预测,得到对应所述第二训练样本的第一分类结果;其中,所述第一文本分类模型基于标注有第一标签的第一训练样本训练得到,所述第一标签对应所述第一类别,所述第一训练样本所标注的所述第一标签的类型包括医学领域、文学领域和经济学领域;
通过第二文本分类模型对所述第一训练样本进行第二类别的分类预测,得到对应所述第一训练样本的第二分类结果;其中,所述第二文本分类模型基于标注有第二标签的第二训练样本训练得到,所述第二标签对应所述第二类别,所述第二训练样本所标注的所述第二标签的类型包括出版物、网络刊物、电子文库和报刊;
以所述第一分类结果作为所述第二训练样本的第三标签,对所述第二训练样本进行标注,并以所述第二分类结果作为所述第一训练样本的第四标签,对所述第一训练样本进行标注;
基于标注有所述第一标签及所述第四标签的所述第一训练样本,及标注有所述第二标签及所述第三标签的所述第二训练样本,训练第一融合文本分类模型,使得所述第一融合文本分类模型能够基于输入的待分类对象,进行所述第一类别和所述第二类别的分类预测,得到相应的分类结果。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
通过第三文本分类模型对组合训练样本进行第三类别的分类预测,得到对应所述组合训练样本的第三分类结果;其中,所述第三文本分类模型基于标注有所述第三类别的分类标签的第三训练样本训练得到,所述组合训练样本用于训练所述第一融合文本分类模型,包括标注有所述第一标签及所述第四标签的第一训练样本、和标注有所述第二标签及所述第三标签的第二训练样本;
通过所述第一融合文本分类模型对第三训练样本进行所述第一类别和第二类别的分类预测,得到对应所述第三训练样本的第一类别和第二类别的分类结果;
以所述第三分类结果作为所述组合训练样本的第五标签,对所述组合训练样本进行标注,并以对应所述第三训练样本的第一类别和第二类别的分类结果作为所述第三训练样本的第六标签,对所述第三训练样本进行标注;
基于标注有所述第五标签的所述组合训练样本、及标注有所述第三类别的分类标签及所述第六标签的所述第三训练样本,训练第二融合文本分类模型,使得所述第二融合文本分类模型能够基于输入的待分类对象,进行所述第一类别、所述第二类别和第三类别的分类预测,得到相应的分类结果。
3.如权利要求1所述的方法,其特征在于,所述基于标注有所述第一标签及所述第四标签的所述第一训练样本,及标注有所述第二标签及所述第三标签的所述第二训练样本,训练第一融合文本分类模型,包括:
基于标注有所述第一标签及所述第四标签的所述第一训练样本,及标注有所述第二标签及所述第三标签的所述第二训练样本,通过所述第一融合文本分类模型进行分类预测,得到对应第一类别和第二类别的分类结果;
获取所述第一类别的分类结果与所述第一标签之间的第一差异、所述第二类别的分类结果与所述第二标签之间的第二差异、所述第一类别的分类结果与所述第三标签之间的第三差异、所述第二类别的分类结果与所述第四标签之间的第四差异;
基于所述第一差异、第二差异、第三差异及第四差异,更新所述第一融合文本分类模型的模型参数。
4.如权利要求3所述的方法,其特征在于,所述基于所述第一差异、第二差异、第三差异及第四差异,更新所述第一融合文本分类模型的模型参数,包括:
基于所述第一差异、第二差异、第三差异及第四差异,确定所述第一融合文本分类模型的损失函数的值;
基于所述第一融合文本分类模型的损失函数的值,更新所述第一融合文本分类模型的模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010113360.8/1.html,转载请声明来源钻瓜专利网。





