[发明专利]用于对产品进行分类的系统和方法在审
| 申请号: | 202011039099.8 | 申请日: | 2020-09-28 |
| 公开(公告)号: | CN112598017A | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 李章焕 | 申请(专利权)人: | 三星显示有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 宋颖娉;康泉 |
| 地址: | 韩国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 产品 进行 分类 系统 方法 | ||
一种用于对产品进行分类的系统和方法。处理器生成第一分类器的第一实例和第二实例,并且基于输入数据集训练实例。基于输入来训练第二分类器,其中第二分类器被配置成学习与输入相关联的隐空间的表示。在隐空间中生成第一补充数据集,其中第一补充数据集是未标记的数据集。基于第一分类器的第一实例生成用于标记第一补充数据集的第一预测;并且基于第一分类器的第二实例生成用于标记第一补充数据集的第二预测。基于第一预测和第二预测生成第一补充数据集的标记注释。至少基于输入数据集和注释的第一补充数据集来训练第三分类器。
相关申请的交叉引用
本申请要求于2019年10月1日提交的,名称为“针对数据不足的知识蒸馏(KNOWLEDGE DISTILLATION FOR DATA INSUFFICENCECY)”的美国临时申请第62/909,053号的优先权和权益,其全部内容通过引用并入本文。
技术领域
根据本公开的实施例的一个或多个方面涉及分类器,并且更具体地涉及用于在可用的训练数据少且不平衡的情况下训练机器学习(ML)分类器的系统和方法。
背景技术
近年来,移动显示行业迅速发展。随着新的类型的显示面板模块和生产方法的部署,仅使用传统机制已经越来越难以检查表面缺陷。期望采用人工智能(AI)来自动预测所制造的显示面板模块是否有瑕疵(例如,被分类为“不良”或“良”)。实际上,期望使用AI来预测其他硬件产品而不仅仅是显示面板模块中的缺陷。
能被推广到新的以前从未见过的数据的AI/ML(人工智能/机器学习)模型(被称为“广义ML模型”)将适合此类任务。然而,当训练数据集不足且高度不平衡时,很难生成广义ML模型。由于制造数据集的性质,数据集的不足和类不平衡是不可避免的问题,并且生成广义机器学习模型是一项艰巨的任务。
因此,需要一种改进的系统和方法,用于从可能在二元类上不平衡的有限训练数据量稳步且稳定地构建AI/ML模型。
发明内容
本公开的实施例针对一种对经由制造过程制造的产品进行分类的方法。处理器接收输入数据集,生成第一分类器的至少第一实例和第二实例,并且基于输入数据集来训练第一分类器的第一实例和第二实例。还基于输入数据集来训练第二分类器,其中,第二分类器被配置成学习与输入数据集相关联的隐空间的表示。处理器进一步在隐空间中生成第一补充数据集,其中,第一补充数据集是未标记的数据集。处理器基于第一分类器的第一实例生成用于标记第一补充数据集的第一预测,并且基于第一分类器的第二实例进一步生成用于标记第一补充数据集的第二预测。处理器基于第一预测和第二预测生成第一补充数据集的标记注释。处理器至少基于输入数据集和注释的第一补充数据集进一步训练第三分类器。所训练的第三分类器被配置成接收待分类的产品的数据,以基于所接收的数据而输出对产品的预测。
在一个实施例中,第一分类器、第二分类器和第三分类器中的每一个是神经网络。
在一个实施例中,第二分类器是变分自编码器。
在一个实施例中,隐空间提供输入数据集的压缩表示。
在一个实施例中,第一补充数据集的生成包括在隐空间中生成随机数据元素。
在一个实施例中,标记注释的生成包括:基于第一预测和第二预测来确定多数类;以及基于多数类来标记第一补充数据集。
在一个实施例中,标记注释的生成包括:确定第一预测的第一概率和第二预测的第二概率;计算第一概率和第二概率的平均值;以及基于所计算的平均值,识别第一补充数据集的类。
在一个实施例中,标记注释的生成包括:基于第一预测,确定多数类的第一概率和少数类的第二概率;基于第二预测,确定多数类的第三概率和少数类的第四概率;计算第一概率和第三概率的第一平均值;计算第二概率和第四概率的第二平均值;以及基于所计算的第一平均值和第二平均值来标记第一补充数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星显示有限公司,未经三星显示有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011039099.8/2.html,转载请声明来源钻瓜专利网。





