[发明专利]基于半监督学习的模型训练方法、装置及电子设备在审
申请号: | 201910066204.8 | 申请日: | 2019-01-24 |
公开(公告)号: | CN111476256A | 公开(公告)日: | 2020-07-31 |
发明(设计)人: | 尹凯;崔娜;刘晨璐;张志伟 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/66 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 孙静;刘芳 |
地址: | 100195 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 模型 训练 方法 装置 电子设备 | ||
本发明实施例提供一种基于半监督学习的模型训练方法、装置及电子设备,该方法包括:将各未标注样本输入至基础模型,获取各未标注样本的特征和预测概率分布;根据各未标注样本的特征和预测概率分布,从多个未标注样本中确定至少一个待标注样本,待标注样本为未标注样本中具有不确定性和代表性的样本;根据各标注样本和经过标注后的各待标注样本,对基础模型进行训练;本实施例中,根据基础模型对未标注样本提取的特征和预测得到的预测概率分布,从未标注样本中选择出具有代表性和不确定性的待标注样本,通过向训练样本集中添加具有代表性和不确定性的样本,能够提高模型的准确率。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种基于半监督学习的模型训练方法、装置及电子设备。
背景技术
目前,机器学习被广泛用于解决数据分类问题,例如:文本分类、图像分类等。以文本分类为例,通过采用机器学习算法对训练集中的文本数据进行学习,得到分类模型,该分类模型可用于对新文本数据的类别进行预测。机器学习算法主要分为三类:有监督学习、半监督学习和无监督学习。
其中,有监督学习需要完成对所有样本数据的标注,标注成本最高。无监督学习是使用完全没有标注的样本数据,根据样本数据本身的分布状况进行分类和预测。半监督学习则是使用少量的标注样本数据和大量的未标注样本数据完成模型的训练,适用于具有少量标注样本数据的场景。
图1为半监督学习过程的示意图,如图1所示,首先使用标注样本对基础模型进行训练,并使用基础模型对未标注样本进行预测,得到预测结果,然后从未标注样本数据中选择一部分样本进行标注,以扩充标注样本集,使用扩充后的标注样本数据重新训练模型,以提升模型的准确率。现有技术中,在从未标注样本数据中选择样本进行标注时,通常随机选择样本,或者根据预测结果选择预测概率高的样本,并且将预测结果作为这些样本的标注。
但是,现有技术在选择未标注样本时,选择出的样本中不可避免的存在着预测错误的样本,这些样本将会携带着错误的标注进入到训练集中,从而影响到样本数据的质量,使得模型的准确率降低。
发明内容
本发明实施例提供一种基于半监督学习的模型训练方法、装置及电子设备,用以提高训练模型的准确率。
第一方面,本发明实施例提供一种基于半监督学习的模型训练方法,包括:
获取训练样本集,所述训练样本集包括多个标注样本和多个未标注样本;
将各所述未标注样本输入至基础模型,获取各所述未标注样本的特征和预测概率分布,所述基础模型为根据所述标注样本训练后的模型;
根据各所述未标注样本的特征和预测概率分布,从所述多个未标注样本中确定至少一个待标注样本,所述待标注样本为所述未标注样本中具有不确定性和代表性的样本;
根据各所述标注样本和经过标注后的各所述待标注样本,对所述基础模型进行训练。
可选的,所述根据各所述未标注样本的特征和预测概率分布,从所述多个未标注样本中确定至少一个待标注样本,包括:
根据各所述未标注样本的特征,确定各所述未标注样本的代表性;
根据各所述未标注样本的预测概率分布,确定各所述未标注样本的不确定性;
根据各所述未标注样本的代表性和不确定性,从所述多个未标注样本中确定至少一个待标注样本。
可选的,所述根据各所述未标注样本的特征,确定各所述未标注样本的代表性,包括:
对各所述未标注样本的特征进行聚类,得到至少一个聚类中心;
根据各所述未标注样本与所属的聚类中心之间的距离,确定各所述未标注样本的代表性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910066204.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种服务集群容灾处理方法及设备
- 下一篇:一种焊接式导条转弯皮带的制造工艺