[发明专利]利用堆叠式自动编码器进行的半监督式分类在审
申请号: | 201780054591.2 | 申请日: | 2017-09-04 |
公开(公告)号: | CN109690577A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | R·加艾尼;S·S·阿尔哈桑;O·F·法里;K·李;V·达特拉;A·卡迪尔;柳俊毅;A·普拉卡什 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李光颖;王英 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本文中描述的技术涉及用于预测和其他用途的堆叠式自动编码器和其他分类器的半监督式训练和应用。在各种实施例中,可以训练半监督式模型(108)以用于句子分类,并且可以将本文中提到的“残余堆叠式去噪自动编码器”(“RSDA”)(220)(其可以是无监督式的)与诸如分类神经网络(例如,多层感知机或“MLP”)的监督式分类器(218)进行组合。在各种实施例中,RSDA可以是堆叠式去噪自动编码器,其可以包括或者可以不包括一个或多个残余连接。如果存在残余连接,则残余连接可以帮助RSDA“记住”跨多层的遗忘信息。在各种实施例中,半监督式模型可以同时利用未标记的数据(用于RSDA)和标记的数据(用于分类器)来训练。 | ||
搜索关键词: | 自动编码器 半监督式 堆叠式 残余连接 分类器 去噪 多层感知 句子分类 神经网络 无监督 分类 多层 遗忘 预测 应用 帮助 监督 | ||
【主权项】:
1.一种方法,包括:在嵌入机器学习模型(210、211A)上应用(602)第一多个句子(330)作为未标记的训练数据以生成多个句子嵌入(334);在自动编码器机器学习模型(220)上应用(604)所述多个句子嵌入作为输入以训练所述自动编码器机器学习模型,其中,所述自动编码器机器学习模型包括一个或多个编码器层(338)和一个或多个解码器层(340);在编码器机器学习模型(212)的一个或多个实例上应用(606)第二多个句子作为标记的训练数据以生成多个编码的嵌入,其中,所述第二多个句子与对应的多个标记相关联,并且其中,所述编码器机器学习模型包括所述自动编码器机器学习模型的所述一个或多个编码器层(338);在分类器(218)上应用(608)所述多个编码的嵌入作为标记的训练数据以生成输出;以及基于所述输出和所述多个标记来训练(610)所述分类器以利用所述多个标记中的一个或多个标记对后续句子进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780054591.2/,转载请声明来源钻瓜专利网。