[发明专利]一种基于WGAN模型的行人检测方法在审
申请号: | 201711124627.8 | 申请日: | 2017-11-14 |
公开(公告)号: | CN108009568A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 周智恒;李立军;胥静;朱湘军;李利苹;汪壮雄 | 申请(专利权)人: | 华南理工大学;广州视声智能股份有限公司;广州视声智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 wgan 模型 行人 检测 方法 | ||
本发明公开了一种基于WGAN模型的行人检测方法,属于深度学习神经网络领域,包括以下步骤:S1、构造原始生成对抗网络模型;S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;S3、初始化随机噪声,输入生成器中;S4、准备好行人图像数据集,输入判别器中训练;S5、将行人检测操作得到的损失函数输入生成器进行后续训练。本方法构建的基于WGAN模型的行人检测方法,引入沃瑟斯坦距离,能够评价整个网络的训练质量,同时通过将行人图像数据集输入判别器中,不断训练判别器的能力,从而能够在复杂的道路图像中准确地判别行人的准确位置。
技术领域
本发明涉及深度学习神经网络技术领域,具体涉及一种基于WGAN模型的行人检测方法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的深度学习框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。
在传统的对抗网络模型中,对于生成器生成图像质量并没有统一的评判标准,且对于数据集没有统一的要求。针对现有技术中存在的上述问题,目的亟待提出一种利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。同时,准备好行人数据集,连同生成器生成图像,输入至判别器中进行训练。通过观察沃瑟斯坦距离,评价判别器的能力。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于WGAN模型的行人检测方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于WGAN模型的行人检测方法,所述的行人检测方法包括下列步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练;
S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
S3、初始化随机噪声,输入生成器中;
S4、准备好行人图像数据集,输入判别器中训练;
S5、将行人检测操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的步骤S4具体过程如下:
S41、准备好行人数据集;
S42、将生成器生成图像与行人数据集输入判别器中进行训练。
进一步地,所述的步骤S5具体过程如下:
S51、观察沃瑟斯坦距离,评价判别器当前辨别行人的能力;
S52、将行人检测操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的损失函数的表达式为:
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学;广州视声智能股份有限公司;广州视声智能科技有限公司,未经华南理工大学;广州视声智能股份有限公司;广州视声智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711124627.8/2.html,转载请声明来源钻瓜专利网。