[发明专利]基于因果流模型的可控汽车图像合成方法有效
| 申请号: | 202010942153.3 | 申请日: | 2020-09-09 |
| 公开(公告)号: | CN112102156B | 公开(公告)日: | 2023-06-09 |
| 发明(设计)人: | 廖军;颜学文;刘礼 | 申请(专利权)人: | 重庆大学 |
| 主分类号: | G06T3/00 | 分类号: | G06T3/00;G06V10/764;G06V10/82;G06N3/0464;G06N3/088 |
| 代理公司: | 重庆缙云专利代理事务所(特殊普通合伙) 50237 | 代理人: | 王翔 |
| 地址: | 400044 *** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 因果 模型 可控 汽车 图像 合成 方法 | ||
本发明公开基于因果流模型的可控汽车图像合成方法,步骤为:1)获取原始汽车图像数据;2)建立可逆流模型psubgt;θ/subgt;(x);3)建立可逆流模型psubgt;θ/subgt;(x)的网络架构;4)输出汽车图像y;5)建立因果关系网络6)根据因果关系网络设置监督条件csubgt;s/subgt;,并建立可控因果编码器Esubgt;θ/subgt;;7)建立监督模块;8)输出合成汽车图片。本发明在原始流模型的基础上,加入了因果网络,能增强监督条件,进而生成符合预期目标的可控汽车图像。
技术领域
本发明涉及图像处理技术领域,具体是基于因果流模型的可控汽车图像合成方法。
背景技术
如今汽车普及度越来越高,汽车保有量大幅提升,积累了大量的汽车图像数据,如何分析这些数据提取有用价值?对于生产商来说,需要分出商品线和市场竞争;对于消费者来说,需要明确购买方向;对于社会来说,需要方便管理规划。合理的利用数据将有效节省人力资源,推进汽车产业智能化发展。
随着深度学习技术不断发展,图像处理方面的研究已经十分成熟了,但是图像可控合成技术多用于人脸识别、军事应用、医学图像等领域,且通用性差,对于汽车图像的研究少之又少,因此,研究汽车图像的可控方法越来越受到人们的关注。目前基于深度学习的合成算法使用大量的图像来训练网络,例如生成对抗网络(GAN),并利用这些网络进行条件图像合成,虽然取得了较好的性能,但仍存在着没有显式的编码器将图像映射到潜在空间,而变分自编码器(VAE)可以做到这一点,但生成的图像往往很模糊。这些问题仍然存在于可控生成的研究课题中。
目前存在一种基于流模型和条件编码器的深度学习架构可以克服上述缺点,流模型的图像空间与潜在空间映射的可逆性、精确对数似然在图像合成中拥有着巨大的潜力,在条件编码器中,将编码输入属性标注作为监督条件作为生成图像中的可控因素,可以保存可控信息,这样的模型必须在图像的分布和潜在向量之间进行双射映射,即其潜在维数必须与可见维数匹配,但是没有办法将条件信息与图像连接到完整的模型中。因此,一个直接的想法就是在优化目标中添加有类依赖化的正则化,但是,当遇到复杂的情况时,模型训练往往会失败,这一现象产生的原因就是潜在空间上的图像条件的底层分布难以精确测量,且存在多目标的情况。
发明内容
本发明的目的是提供基于因果流模型的可控汽车图像合成方法,包括以下步骤:
1)获取原始汽车图像数据,并写入汽车图像数据集D中。对汽车图像数据集D进行预处理,得到汽车图像数据集D′=[D1,D2,....,DX]。X为汽车图像样本总数。DX表示汽车图像样本。
所述原始汽车图像数据为斯坦福汽车图像数据。所述斯坦福汽车图像根据年份、制造商、型号进行分类。
对汽车图像数据集D进行预处理的步骤如下:
1.1)提取汽车图像的序号、图像名和类别名。
1.2)删除汽车图像数据集D中的灰度汽车图像。删除汽车图像数据集D中长宽像素比小于h的汽车图像。删除汽车图像数据集D中图像字节数小于Hkb的汽车图像。
1.3)将汽车图像数据集D中汽车图像像素统一为n×n,得到汽车图像数据集D′。
1.4)为汽车图像数据集D′中每张汽车图像添加属性标注。所述属性包括汽车颜色、汽车尺寸、车前大灯、车窗玻璃、天窗、车型、车轮、车尾组合灯、车门、车顶、外边后视镜、后风挡玻璃、车牌、雨刮器、行李车门。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010942153.3/2.html,转载请声明来源钻瓜专利网。





