[发明专利]一种分类模型训练方法及装置、存储介质在审

申请号：	202010048889.6	申请日：	2020-01-16
公开（公告）号：	CN111275089A	公开（公告）日：	2020-06-12
发明（设计）人：	徐泽宇;邓雄文	申请（专利权）人：	北京松果电子有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京善任知识产权代理有限公司 11650	代理人：	康艳青
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种分类模型训练方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开是关于一种分类模型训练方法及装置、存储介质。分类模型训练方法，包括：利用已知离散标签的第一数据集进行分类模型的初始训练，得到第一分类模型；将第一数据集内的样本数据输入到第一分类模型，得到连续标签；利用样本数据和连续标签构成的第二数据集，继续训练第一分类模型得到第二分类模型；利用第二分类模型对第一数据集包含的样本数据进行分类，得到第二分类模型输出的连续标签；将第二分类模型输出的连续标签满足存疑条件的样本数据输出，以获得对样本数据重新标注的离散标签，以更新第二数据集；利用更新后的第二数据集继续训练第二分类模型，直到满足训练停止条件。

技术领域

本公开涉及信息技术领域，尤其涉及一种分类模型训练方法及装置、存储介质。

背景技术

神经网络等可以构成分类模型。分类模型可以用于对图像和文本进行分类。但是这种分类模型在使用之前，需要使用标注好的样本数据进行标注。且由于分类模型训练涉及大量样本数据的标注，具有标注工作量大，且若标注工作量大伴随有标注错误时，可能会导致训练得到的分类模型的精确度差的现象。

发明内容

本公开提供一种分类模型训练方法及装置、存储介质。

本公开实施例第一方面提供一种分类模型训练方法，包括：

利用已知离散标签的第一数据集进行分类模型的初始训练，得到第一分类模型；其中，所述离散标签，用于指示所述第一数据集内样本数据的类别；

将所述第一数据集内的样本数据输入到所述第一分类模型，得到连续标签，其中，所述连续标签，用于指示所述样本数据为对应类别的概率；

利用所述样本数据和所述连续标签构成的第二数据集，继续训练所述第一分类模型得到第二分类模型；

利用所述第二分类模型对所述第一数据集包含的样本数据进行分类，得到所述第二分类模型输出的连续标签；

将所述第二分类模型输出的连续标签满足存疑条件的所述样本数据输出，以获得对所述样本数据重新标注的离散标签，以更新所述第二数据集；