[发明专利]一种基于循环生成式对抗网络的行人图像生成方法及系统在审
申请号: | 201711435515.4 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108256439A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 张史梁;田奇;高文;魏龙辉 | 申请(专利权)人: | 北京大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 迁移 生成式 对抗 图像生成 图像 网络 数据库 公共数据集 额外数据 函数学习 目标应用 鲁棒 标注 场景 风格 身份 | ||
本发明提供了一种基于循环生成式对抗网络的行人图像生成方法及系统,包括如下步骤:迁移函数学习,生成人物迁移生成式对抗网络;基于所述人物迁移生成式对抗网络,完成所述行人图像中的人物迁移,将一个数据库中的行人图像迁移到另一个数据库中,生成新的行人图像。所述迁移函数包括风格损失和身份损失。与传统方法相比,本发明在众多行人再识别公共数据集上取得了很好的迁移效果,可以在无需额外数据标注的前提下,在目标应用场景中训练鲁棒的行人再识别模型,并获得较高的准确性。
技术领域
本发明涉及图像识别技术领域,尤其是涉及一种基于生成式对抗网络的行人图像生成方法及系统。
背景技术
近年来,随着人们对社会的公共安全越来越关注,视频监控系统大量普及。诸如机场、火车站、校园和办公大楼等公众场所,都亟需监控,为安防保驾护航。面对海量的监控视频数据,大量的人力需要投入到视频信息的监控与检索中去,这种方式的效率不仅低,还造成了额外资源浪费。如果能够利用计算机视觉分析技术,自动化监控及分析视频信息,必然可以极大地加快“平安城市”的建设。
行人再识别是计算机视觉的研究中关键的任务。一般来说,给定关于行人的一张图片或者一段视频,行人再识别就是在其它不重合拍摄场景下的图片或者视频中,将同一个人识别出来的过程。尽管相关的研究越来越受到重视,行人再识别的准确率也已经提高了不少,但仍有许多困难需要解决。由于待识别的行人图片与原图片拍摄于不同的相机,设备的差异会给成像条件带来误差;不同的场景下的环境不一,对采集的数据也会产生不同的偏差;且光照的改变会使得同一种颜色的表现不同;更重要的是,行人在摄像头下的姿态变化以及遮挡问题,都使得对同一个人的辨别难度相当大。
行人再识别中,背景、光照、摄像机参数等因素变化往往导致可用的标注数据集与目标应用场景数据之间存在较大差异。直接使用此类标注数据训练得到的模型在不同类型的应用场景中性能较差。
发明内容
为解决以上问题,本发明显式地利用生成式模型对已标注的行人图像数据进行迁移,使得迁移后的数据符合目标应用场景中的数据特点,从而使迁移后的数据可以更有效的应用于目标场景中的模型训练任务。
根据本发明的一个方面,提供了一种基于循环生成式对抗网络的行人图像生成方法,包括如下步骤:
迁移函数学习,生成人物迁移生成式对抗网络;
基于所述人物迁移生成式对抗网络,完成所述行人图像中的人物迁移,将一个数据库中的行人图像迁移到另一个数据库中,生成新的行人图像。
优选的,所述迁移函数包括风格损失和身份损失。
优选的,所述人物迁移生成式对抗网络的目标函数为:
其中,表示风格损失,表示身份损失,λ1表示两种损失之间的交换系数。
优选的,所述风格损失为:
其中,表示标准对抗损失,表示循环一致性损失,G表示从数据集A到B的风格映射函数,而表示从数据集B到A的风格映射函数,DA和DB分别表示A和B的风格鉴别器,λ2表示交换系数。
优选的,所述风格鉴别器DA、DB分别由数据集A、B内的未标签人物图像训练得到。
优选的,所述身份损失为:
其中,G(a)表示从图像a中迁移到数据集B的人物图像,表示从图像b中迁移到数据集A的人物图像,M(a)表示图像a的前景模板,M(b)表示图像b的前景模板,表示从数据集A中采样出的图像a的数学期望,表示从数据集B中采样出的图像b的数学期望。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711435515.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于后端人脸识别视频监控方法及装置
- 下一篇:一种眉毛图像分割方法和系统