[发明专利]模型训练方法、移动对象识别方法、装置及设备在审
申请号: | 202010568176.2 | 申请日: | 2020-06-19 |
公开(公告)号: | CN113515983A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 王弘烈;郭莉琳;周橹楠;邓兵 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N20/00 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 孙明子;刘戈 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 移动 对象 识别 装置 设备 | ||
1.一种模型训练方法,其特征在于,包括:
获取包括预设对象的训练图像以及与所述预设对象相对应的身份信息;
利用第一机器学习模型对所述训练图像进行处理,获得与所述训练图像相对应的第一训练特征;
利用第二机器学习模型对所述训练图像进行处理,获得与所述训练图像相对应的第二训练特征,其中,所述第一机器学习模型与所述第二机器学习模型不同,所述第一训练特征与所述第二训练特征不同;
基于所述第一训练特征、第二训练特征、与预设对象相对应的身份信息进行学习训练,获得用于识别图像中预设对象的身份信息的目标模型。
2.根据权利要求1所述的方法,其特征在于,所述训练图像的数量为多个,在获取包括预设对象的训练图像之后,所述方法还包括:
对多个训练图像进行像素归一化处理,获得与所述多个训练图像相对应的多个中间图像;
对所述多个中间图像进行色域转换处理,获得与所述多个训练图像相对应的多个目标训练图像。
3.根据权利要求1所述的方法,其特征在于,所述第一机器学习模型包括注意力机制,所述第二机器学习模型包括由卷积神经网络所构成的透视转换子网络、残差子网络和转置卷积子网络。
4.根据权利要求3所述的方法,其特征在于,利用第一机器学习模型对所述训练图像进行处理,获得与所述训练图像相对应的第一训练特征,包括:
利用注意力机制对所述训练图像进行处理,获得与所述训练图像所对应的特征权重系数;
基于所述特征权重系数和所述训练图像,获得与所述训练图像相对应的第一训练特征。
5.根据权利要求4所述的方法,其特征在于,基于所述特征权重系数和所述训练图像,获得与所述训练图像相对应的第一训练特征,包括:
确定与所述特征权重系数相对应的目标权重系数,其中,所述目标权重系数的非线性程度大于所述特征权重系数的非线性程度;
基于所述目标权重系数和训练图像,获得所述第一训练特征。
6.根据权利要求5所述的方法,其特征在于,确定与所述特征权重系数相对应的目标权重系数,包括:
获取用于增加所述特征权重系数的非线性程度的激活函数;
利用所述激活函数对所述特征权重系数进行处理,获得所述目标权重系数。
7.根据权利要求6所述的方法,其特征在于,利用所述激活函数对所述特征权重系数进行处理,获得所述目标权重系数,包括:
利用所述激活函数对所述特征权重系数进行处理,获得处理后权重系数;
对所述处理后权重系数进行归一化处理,获得所述目标权重系数。
8.根据权利要求5所述的方法,其特征在于,基于所述目标权重系数和训练图像,获得所述第一训练特征,包括:
将所述目标权重系数与所述训练图像的乘积,确定为所述第一训练特征。
9.根据权利要求3所述的方法,其特征在于,利用第二机器学习模型对所述训练图像进行处理,获得与所述训练图像相对应的第二训练特征,包括:
利用所述透视转换子网络对所述训练图像进行分析处理,获得与所述训练图像相对应的图像变换矩阵;
基于所述图像变换矩阵,获得与所述训练图像相对应的第二训练特征。
10.根据权利要求9所述的方法,其特征在于,利用所述透视转换子网络对所述训练图像进行分析处理,获得与所述训练图像相对应的图像变换矩阵,包括:
获取所述训练图像中的像素点坐标信息;
利用所述透视转换子网络对所述像素点坐标信息进行分析处理,获得与所述训练图像相对应的图像变换矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010568176.2/1.html,转载请声明来源钻瓜专利网。