[发明专利]用于基于四元数的机器学习系统的基于梯度的训练引擎在审
申请号: | 201880028671.5 | 申请日: | 2018-05-31 |
公开(公告)号: | CN110574050A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | M·L·马丁内兹-卡纳莱斯;S·K·辛格;V·沙尔玛;M·K·布汉达鲁 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 31100 上海专利商标事务所有限公司 | 代理人: | 黄嵩泉;何焜 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 四元数 隐藏层 多个变量 损失函数 输入层 共轭 计算损失函数 参数执行 反向传播 路径布置 前向操作 前向传播 前向路径 神经网络 数值信号 训练操作 训练数据 预期结果 偏导数 输出层 正交基 引擎 输出 | ||
1.一种用于操作深度神经网络(DNN)的方法,所述方法包括:
提供输入层、输出层和多个隐藏层,所述多个隐藏层沿所述输入层与所述输出层之间的前向传播路径布置;
其中所述输入层用于接受包括四元数值的训练数据,并且用于沿所述前向传播路径将四元数值信号输出到所述多个隐藏层中的至少一个隐藏层;
其中所述隐藏层中的至少一些隐藏层包括四元数层,所述四元数层用于基于一个或多个变量参数来执行一致的四元数(QT)前向操作,以沿所述前向传播路径产生对应的至少一个特征图输出;
其中所述输出层用于产生基于所述QT前向操作的DNN结果;
提供损失函数引擎以产生损失函数,所述损失函数表示所述DNN结果与预期结果之间的误差;
执行基于QT反向传播的训练操作,所述基于QT反向传播的训练操作包括:
计算所述损失函数相对于所述一个或多个变量参数的QT共轭以及所述四元数层的各个输入的QT共轭的与四元数空间的正交基一致的逐层QT偏导数,所述QT偏导数是依次通过所述多个隐藏层、沿与所述前向传播路径相反的后向传播路径而取得的;以及
基于所述QT偏导数来更新所述变量参数以减少归因于每个相应的隐藏层的误差。
2.如权利要求1所述的方法,其特征在于,所述逐层QT偏导数的计算产生所述损失函数相对于所述隐藏层的所有变量参数的QT梯度。
3.如权利要求1所述的方法,其特征在于,所述QT前向操作包括在第一层处的QT卷积操作,并且其中,所述一个或多个变量参数包括四元数值偏置参数;并且
其中,计算所述逐层QT偏导数包括:计算所述损失函数相对于所述偏置参数的QT共轭的偏导数。
4.如权利要求3所述的方法,其特征在于,基于所述损失函数相对于所述QT卷积操作的输出的QT共轭的偏导数的计算来实现所述损失函数相对于所述偏置参数的QT共轭的偏导数的计算。
5.如权利要求3所述的方法,其特征在于,所述训练数据包括具有像素索引x和y的图像,并且其中,基于所述损失函数相对于在所述第一层处的所述QT卷积操作的输出的QT偏导数的、对所述像素索引x和y的QT求和来计算所述损失函数相对于所述偏置参数的QT共轭的偏导数。
6.如权利要求1所述的方法,其特征在于,所述QT前向操作包括在第一层处的QT卷积操作,并且其中,所述一个或多个变量参数包括四元数值权重参数;并且
其中,计算逐层QT偏导数包括:计算所述损失函数相对于所述权重参数的QT共轭的偏导数。
7.如权利要求6所述的方法,其特征在于,基于所述损失函数相对于所述QT卷积操作的输出的QT共轭的偏导数的计算来实现计算所述损失函数相对于所述权重参数的QT共轭的偏导数。
8.如权利要求6所述的方法,其特征在于,所述训练数据包括具有像素索引x和y的图像,并且其中,基于所述损失函数相对于在所述第一层处的所述QT卷积操作的输出的QT偏导数的、对所述像素索引x和y的QT求和来计算所述损失函数相对于所述权重参数的QT共轭的偏导数。
9.如权利要求1所述的方法,其特征在于,所述QT前向操作包括在第一层处的QT卷积操作,其中,所述QT卷积操作接受来自先前层的第一四元数值特征图作为输入;并且
其中,计算逐层QT偏导数包括:计算所述损失函数相对于所述第一四元数值特征图的QT共轭的偏导数。
10.如权利要求9所述的方法,其特征在于,基于所述损失函数相对于所述QT卷积操作的输出的QT共轭的偏导数的计算来实现计算所述损失函数相对于所述第一四元数值特征图的QT共轭的偏导数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880028671.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多任务多模态机器学习系统
- 下一篇:计算高效的基于四元数的机器学习系统