[发明专利]学习来选择类别特征的词汇在审
| 申请号: | 202010450032.7 | 申请日: | 2020-05-25 |
| 公开(公告)号: | CN111652378A | 公开(公告)日: | 2020-09-11 |
| 发明(设计)人: | 李聪;杰伊·亚当斯;马纳斯·约戈莱卡尔;普拉纳夫·柯海坦;国·V·勒;陈媚 | 申请(专利权)人: | 谷歌有限责任公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/08 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;邓聪惠 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 学习 选择 类别 特征 词汇 | ||
本公开涉及学习来选择类别特征的词汇。方法、系统和设备,包括在计算机存储介质上编码的计算机程序,以用于针对一个或多个类别特征中的每个类别特征确定在由机器学习模型对输入进行处理期间应该有效的所述类别特征的类别特征值的相应词汇。在一个方面中,一种方法包括:生成一个批次的输出序列,所述批次中的每个输出序列针对所述类别特征中的每个类别特征指定应该有效的所述类别特征的类别特征值的相应词汇;对于所述批次中的每个输出序列,在所述机器学习模型已经被训练成在仅由所述输出序列指定的每个类别特征的类别特征值的相应词汇有效的情况下执行机器学习任务之后确定所述机器学习模型在所述机器学习任务上的性能度量。
技术领域
本说明书涉及使用机器学习模型来处理数据。
背景技术
机器学习模型接收输入并且基于接收到的输入生成输出,例如,预测输出。一些机器学习模型是参数模型并且基于接收到的输入和该模型的参数的值生成输出。
一些机器学习模型是针对接收到的输入采用模型的多个层来生成输出的深度模型。例如,深度神经网络是包括输出层和一个或多个隐藏层的深度机器学习模型,所述一个或多个隐藏层均对接收到的输入应用非线性变换以生成输出。
发明内容
本说明书描述了一种作为计算机程序实现在一个或多个位置中的一个或多个计算机上的系统,所述系统训练机器学习模型,所述机器学习模型被配置成处理包括类别特征值的输入。如贯穿本说明书所用,类别特征是指仅能够假定可能特征值的离散(例如,有限)集合中的值的特征。
根据第一方面,提供了一种由一个或多个数据处理设备执行以用于针对一个或多个类别特征中的每个类别特征确定在由具有多个机器学习模型参数的机器学习模型对输入进行处理期间应该有效的所述类别特征的类别特征值的相应词汇的方法,所述方法包括:使用具有多个控制器参数的控制器神经网络并且依照所述控制器参数的当前值来生成一个批次输出序列,所述批次中的每个输出序列针对所述类别特征中的每个类别特征指定该类别特征的类别特征值的相应词汇,该相应词汇:(i)在由所述机器学习模型对输入进行处理期间应该是有效的,并且(ii)是该类别特征的可能类别特征值的离散集合的子集;对于所述批次中的每个输出序列,在所述机器学习模型已经被训练成在仅由所述输出序列指定的每个类别特征的类别特征值的相应词汇有效的情况下执行机器学习任务之后确定所述机器学习模型在所述机器学习任务上的性能度量,其中在所述训练期间:所述机器学习模型被配置成通过执行包括以下项的操作来处理包括相应类别特征的一个或多个可能类别特征值的输入:对于仅所述输入中包括的由所述输出序列指定为有效的那些可能类别特征值,将所述可能类别特征值映射到在所述训练期间迭代地调整的对应嵌入;并且针对所述输入处理所述嵌入以生成机器学习模型输出;以及使用所述批次中的所述输出序列的所述性能度量来调整所述控制器神经网络的控制器参数的当前值。
在一些实现方式中,所述批次中的每个输出序列附加地指定与在由所述机器学习模型对输入进行处理期间由所述输出序列指定为有效的每个类别特征值相对应的相应嵌入维数;并且对于所述批次中的每个输出序列,在所述训练期间,所述机器学习模型被配置成将所述输入中包括的由所述输出序列指定为有效的每个可能类别特征值映射到具有由所述输出序列指定的所述嵌入维数的对应嵌入。
在一些实现方式中,每个输出序列针对给定类别特征的不同类别特征值指定不同嵌入维数。
在一些实现方式中,所述机器学习模型包括与每个类别特征相对应的相应多个嵌入模型;与类别特征相对应的嵌入模型定义所述类别特征的一个或多个类别特征值中的每个类别特征至到具有相应维数的所述类别特征值的对应子嵌入的映射;所述批次中的每个输出序列针对所述类别特征中的每个类别特征指定与所述类别特征相对应的一个或多个嵌入模型;并且将所述输入中包括的给定类别特征的给定类别特征值映射到对应嵌入包括:针对由所述输出序列针对所述给定类别特征指定的定义所述给定类别特征值到对应子嵌入的映射的每个嵌入模型,使用所述嵌入模型来将所述给定类别特征值映射到所述对应子嵌入;并且基于所述子嵌入确定所述给定类别特征值的嵌入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010450032.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种配电站房智能管控方法
- 下一篇:一种以介质共享为核心的终端系统





