[发明专利]借助类优先级的离散特征表示在审
| 申请号: | 202010100782.1 | 申请日: | 2020-02-19 |
| 公开(公告)号: | CN111639760A | 公开(公告)日: | 2020-09-08 |
| 发明(设计)人: | 浅井政太郎 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 李颖 |
| 地址: | 美国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 借助 优先级 离散 特征 表示 | ||
本公开涉及借助类优先级的离散特征表示。通过训练具有输出层的神经网络,以便输出离散值,来训练离散神经网络。输出层包括多个节点。每个节点对应于多个类中的一个。所述训练包括根据对应类,按优先级激活节点。
技术领域
本发明涉及神经网络的借助类优先级的离散特征表示。
背景技术
在计算机科学领域,开发了提供问题(例如,8数码难题)的解答的问题求解器。由于问题求解器并不照原样直接处理问题(例如,8数码难题的各个拼图的图像),因此必须把问题变换成其离散表示。
离散自编码器可以输出输入数据的离散表示。然而,传统的离散自编码器难以训练。即使成功地受过训练,它们也可能只产生不稳定的表示,这对问题求解来说并不理想。于是,传统的自编码器需要仔细的微调,这可能会消耗过多的计算资源。
发明内容
按照本发明的实施例,为神经网络训练提供一种计算机实现的方法。所述计算机实现的方法包括训练具有输出层的神经网络,以便输出离散值,其中所述输出层包括多个节点,每个节点对应于多个类中的一个类,其中所述训练包括根据对应类,按优先级激活节点。
上述实施例还可包括配置成进行所述计算机实现的方法的设备,和保存包含在计算机可读介质或可编程电路上的指令的计算机程序产品,当由处理器或可编程电路执行时,所述指令使处理器或可编程电路进行所述方法。
发明内容部分未必描述本发明的实施例的所有特征。本发明的实施例还可以包括上述特征的子组合。
附图说明
下面的说明将参考以下附图,提供优选实施例的细节,附图中:
图1表示按照本发明的实施例的设备10的例证构成;
图2表示按照本发明的实施例的神经网络;
图3表示按照本发明的实施例的神经网络;
图4表示按照本发明的实施例的操作流程;
图5表示按照本发明的实施例的输出层330的结构;
图6表示按照本发明的实施例的训练期间的类优先级;
图7表示按照本发明的实施例的删除变量;
图8表示按照本发明的实施例的替换输出层;
图9表示按照本发明的实施例的训练期间的再一个类优先级;
图10表示按照本发明的实施例的训练期间的另一个类优先级;
图11表示按照本发明的实施例的删除类;和
图12表示按照本发明的实施例,起系统作用的计算机的例证硬件构成。
具体实施方式
下面将说明本发明的例证实施例。例证实施例不应限制按照权利要求书的本发明,记载在实施例中的特征的组合不一定是本发明所必需的。
图1表示按照本发明的实施例的设备10的例证构成。设备10可以通过借助优先级激活节点来训练离散神经网络。从而,设备10能够快得多地和/或以更少的计算资源生成稳定且准确的受过训练的神经网络。
设备10可包括处理器和/或可编程电路。设备10还可包括共同包括指令的一个或多个计算机可读介质。指令可以包含在计算机可读介质和/或可编程电路上。当由处理器或可编程电路执行时,所述指令可以使处理器或可编程电路起多个操作部分的作用。
从而,设备10可被视为包括存储部分100、获得部分110、训练部分120、识别部分130、删除部分140和替换部分150。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010100782.1/2.html,转载请声明来源钻瓜专利网。





