[发明专利]使用教师-学生学习模式进行模型训练在审
| 申请号: | 202010527266.7 | 申请日: | 2020-06-11 |
| 公开(公告)号: | CN112132170A | 公开(公告)日: | 2020-12-25 |
| 发明(设计)人: | 刘喆;A·密斯拉;P·古恩德查;J·马哈姆德;Y·巴哈尔加特 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06Q50/20 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 李颖 |
| 地址: | 美国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 教师 学生 学习 模式 进行 模型 训练 | ||
1.一种系统,包括:
第一分类器和第二分类器,被配置为使用标记数据集的子集进行训练,其中,当从未标记数据集中预测伪标记数据集时,所述第一分类器和第二分类器具有超过教师阈值的预测概率;
第三分类器,被配置为使用标记数据集的子集进行训练,其中,当预测伪标记数据集时,所述第三分类器具有低于学生阈值的预测概率;
角色分配器,被配置为基于来自未标记数据集的样本的预测概率,将教师角色和学生角色分配给第一分类器、第二分类器和第三分类器;以及
来自所述伪标记数据集的教学样本数据集,其中所述教学样本数据集包括来自所述伪标记数据集的至少一个样本,其中所述第一分类器和所述第二分类器在该样本的标记上一致,并且所述预测概率超过所述教师阈值,并且其中所述第三分类器的所述预测概率低于所述学生阈值。
2.如权利要求1所述的系统,其中所述子集是由随机特征分割确定的独立特征集。
3.如权利要求1所述的系统,其中所述子集是由所述标记数据集的自举标记数据集确定的。
4.如权利要求1所述的系统,其中所述教师阈值和所述学生阈值在训练迭代后是可调整的。
5.如权利要求1所述的系统,进一步包括停止准则组件,被配置为确定系统是否达到停止准则。
6.如权利要求5所述的系统,其中当所述学生阈值至少与所述教师阈值一样高时,确定所述停止准则。
7.一种方法,包括:
使用标记数据集的子集训练第一分类器、第二分类器和第三分类器;
使用所述第一分类器、所述第二分类器和所述第三分类器从未标记数据集中预测伪标记数据集;
基于预测阈值和标记约定,将角色分配给所述第一分类器、所述第二分类器和所述第三分类器;
基于分配给所述第三分类器的角色,从所述伪标记数据集中选择教学样本数据集;
使用所述教学样本数据集和所述标记数据集重新训练所述第三分类器;
更新所述预测阈值;以及
达到停止准则。
8.如权利要求7所述的方法,其中分配所述角色包括:
检索所述第一分类器对所述伪标记数据集的样本进行的第一标记和相应的第一预测概率;
检索所述第二分类器对所述伪标记数据集的所述样本进行的第二标记和相应的第二预测概率;
检索所述第三分类器对所述伪标记数据集的所述样本进行的第三标记和相应的第三预测概率;
基于所述第一预测概率和所述第二预测概率超过教学阈值,并基于所述第一标记与所述第二标记一致,为所述第一分类器和所述第二分类器分配教师角色;以及
基于所述第三个预测概率不超过学生阈值,为所述第三分类器分配学生角色。
9.如权利要求7所述的方法,其中所述子集是由独立随机特征分割确定的独立特征集。
10.如权利要求7所述的方法,其中所述子集由所述标记数据集的自举标记数据集确定。
11.如权利要求7所述的方法,其中更新所述预测阈值包括:
通过教学增量降低所述预测阈值的教师阈值;以及
通过学习增量增加所述预测阈值的学生阈值。
12.如权利要求11所述的方法,其中,所述教学增量和所述学习增量是静态增量。
13.如权利要求11所述的方法,其中,所述教学增量和所述学习增量是在每次迭代之后可调整的预定数量。
14.如权利要求7所述的方法,还包括:
基于所述第一分类器、所述第二分类器和所述第三分类器的多数票提供最终预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010527266.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新能源汽车电池修复检查设备
- 下一篇:由烃制备醇的方法





