[发明专利]行人再识别网络的训练方法、行人再识别方法和装置在审
申请号: | 201910839017.9 | 申请日: | 2019-09-05 |
公开(公告)号: | CN112446270A | 公开(公告)日: | 2021-03-05 |
发明(设计)人: | 魏龙辉;张天宇;谢凌曦;田奇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 张振;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行人 识别 网络 训练 方法 装置 | ||
本申请提供了行人再识别网络的训练方法、行人再识别方法和装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:获取M个训练图像和该M个训练图像的标注数据;对行人再识别网络的网络参数进行初始化处理,以得到所述行人再识别网络的网络参数的初始值;将M个训练图像中的一批训练图像输入到行人再识别网络进行特征提取,得到这一批训练图像中的每个训练图像的特征向量,然后根据这一批训练图像的特征向量确定损失函数,并根据损失函数的函数值得到满足预设要求的行人再识别网络。本申请可以在单图像拍摄设备标注数据情况下训练出性能较好的行人再识别网络。
技术领域
本申请涉及计算机视觉领域,并且更具体地,涉及一种行人再识别网络的训练方法、行人再识别方法和装置。
背景技术
计算机视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分,它是一门关于如何运用照相机/图像拍摄设备和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机/图像拍摄设备)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等,从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说,计算机视觉就是用各种成像系统代替视觉器官获取输入信息,再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。
监控领域常常涉及行人再识别的问题,行人重识别(person re-identification,ReID)也可以称为行人再识别,行人再识别是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术。
传统方案一般是训练数据以及跨图像拍摄设备的标注数据,对行人再识别网络进行训练,使得行人再识别网络能够区分开不同行人的图像,进而进行行人的识别。但是,传统方案中的训练数据中包括同一行人由不同图像拍摄设备拍摄的图像,对于这种由不同图像拍摄设备拍摄的图像需要人工进行标注,使得同一行人由不同图像拍摄设备拍摄的图像关联起来(也就是将行人进行跨图像拍摄设备的关联)。但是,在很多场景下,将行人进行跨图像拍摄设备的关联非常困难,尤其是当人数增多、图像拍摄设备数量增多时,进行跨图像拍摄设备关联的难度也随之大幅提升。数据标注的经济成本高,时间消耗大。
发明内容
本申请提供一种行人再识别网络的训练方法、行人再识别方法和装置,以在单图像拍摄设备标注数据情况下训练出性能较好的行人再识别网络。
第一方面,提供了一种行人再识别网络的训练方法,该方法包括:
步骤1:获取训练数据;
其中,步骤1中的训练数据包括M个训练图像和M个训练图像的标注数据,M为大于1的整数;
步骤2:对行人再识别网络的网络参数进行初始化处理,以得到行人再识别网络的网络参数的初始值;
重复执行下面的步骤3至步骤5,直到行人再识别网络满足预设要求;
步骤3:将M个训练图像中的一批训练图像输入到行人再识别网络进行特征提取,得到一批训练图像中的每个训练图像的特征向量;
步骤4:根据一批训练图像的特征向量确定损失函数的函数值;
步骤5:根据损失函数的函数值对行人再识别网络的网络参数进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910839017.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双波长激光装置
- 下一篇:噪声控制系统、方法、装置和汽车