[发明专利]基于变换识别的自监督表征学习方法及装置有效
| 申请号: | 201910134114.8 | 申请日: | 2019-02-22 |
| 公开(公告)号: | CN109858563B | 公开(公告)日: | 2021-04-06 |
| 发明(设计)人: | 鲁继文;周杰;陈志祥 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T3/60 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 变换 识别 监督 表征 学习方法 装置 | ||
1.一种基于变换识别的自监督表征学习方法,其特征在于,包括以下步骤:
步骤S1,根据训练图片集和选定的缩放操作和旋转操作构建变换图像;
步骤S2,初始化神经网络参数,并获取每张原始图像和变换图像的表征;
步骤S3,对所述每张原始图像和变换图像的表征进行分组,并构建损失函数;
步骤S4,通过所述损失函数对表征求导,并更新学习到的表征和更新网络参数;以及
步骤S5,通过所述损失函数持续更新所述表征与所述网络参数,直到满足预设条件,训练结束。
2.根据权利要求1所述的基于变换识别的自监督表征学习方法,其特征在于,所述步骤S1包括:
选取不同的所述缩放操作gZ=Z(p,m),其中,p为缩放中心,m为缩放倍数,和所述旋转操作gR=R(d),其中,d为旋转角度;
使用所述缩放操作和所述旋转操作对训练集里的图片X={x1,x2,…,xN}分别进行变换操作,以得到每张图片对应的变换后的图片g(x)。
3.根据权利要求2所述的基于变换识别的自监督表征学习方法,其特征在于,所述步骤S2包括:
初始化所述神经网络参数;
使用初始化的神经网络获取所述每张原始图像和所述变换图像的表征F(g(x))。
4.根据权利要求3所述的基于变换识别的自监督表征学习方法,其特征在于,所述步骤S3包括:
对所述表征F(g(x))按照缩放和旋转进行分组,以得到缩放分组和旋转分组;
分别对所述缩放分组和所述旋转分组使用交叉熵得到损失函数lZ和损失函数lR;
通过所述损失函数lZ和所述损失函数lR加权求和并对所有训练图片求和得到最终损失函数L。
5.根据权利要求1或4所述的基于变换识别的自监督表征学习方法,其特征在于,所述步骤S4包括:
根据目标函数对局部特征求导;
根据随机梯度下降法更新所述表征与所述网络参数。
6.一种基于变换识别的自监督表征学习装置,其特征在于,包括:
构建模块,用于根据训练图片集和选定的缩放操作和旋转操作构建变换图像;
获取模块,用于初始化神经网络参数,并获取每张原始图像和变换图像的表征;
分组模块,用于对所述每张原始图像和变换图像的表征进行分组,并构建损失函数;
更新模块,用于通过所述损失函数对表征求导,并更新学习到的表征和更新网络参数;以及
训练模块,用于通过所述损失函数持续更新所述表征与所述网络参数,直到满足预设条件,训练结束。
7.根据权利要求6所述的基于变换识别的自监督表征学习装置,其特征在于,所述构建模块包括:
选取子模块,用于选取不同的所述缩放操作gZ=Z(p,m),其中,p为缩放中心,m为缩放倍数,和所述旋转操作gR=R(d),其中,d为旋转角度;
变换子模块,用于使用所述缩放操作和所述旋转操作对训练集里的图片X={x1,x2,…,xN}分别进行变换操作,以得到每张图片对应的变换后的图片g(x)。
8.根据权利要求7所述的基于变换识别的自监督表征学习装置,其特征在于,所述获取模块包括:
初始化子模块,用于初始化所述神经网络参数;
获取子模块,用于使用初始化的神经网络获取所述每张原始图像和所述变换图像的表征F(g(x))。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910134114.8/1.html,转载请声明来源钻瓜专利网。





