[发明专利]一种基于图像处理的最大间隔深度生成模型的生成方法有效
| 申请号: | 201510609808.4 | 申请日: | 2015-09-22 |
| 公开(公告)号: | CN105224948B | 公开(公告)日: | 2019-03-01 |
| 发明(设计)人: | 朱军;李崇轩;张钹 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/55 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图像 处理 最大 间隔 深度 生成 模型 方法 | ||
1.一种基于图像处理的最大间隔深度生成模型的生成方法,其特征在于,包括:
构建带有标注的图片样例的集合,获取所述集合中每个图片样例的隐藏表示,并综合所述隐藏表示以及所述图片样例的标注,获得最大间隔正则化因子;
获取隐藏变量分布的参数,并根据所述隐藏变量分布的参数采样隐藏变量,计算所述隐藏变量变分后验分布和先验分布的相对熵;
获取每个图片样例生成分布的参数,并根据所述图片样例生成分布的参数对所述图片样例进行概率重建,得到概率重建误差;
将所述最大间隔正则化因子、相对熵以及概率重建误差求和,得到最大间隔深度生成模型;
其中,所述隐藏变量分布的参数根据所述隐藏表示计算得到;
所述图片样例生成分布的参数根据所述隐藏变量计算得到。
2.如权利要求1所述的生成方法,其特征在于,
所述集合中每个图片样例的隐藏表示,是利用编码网络计算得到;
所述每个图片样例的生成分布参数,是根据所述隐藏变量,通过解码网络计算得到的。
3.如权利要求2所述的生成方法,其特征在于,所述解码网路包括:
反池化:将所述隐藏变量的每个单元扩张为多个子单元组成的正方形,所述正方形中左上角子单元的值等于所述隐藏变量单元的值,其余所述子单元的值为0,得到反池化结果;
卷积:对所述反池化结果进行卷积;
非线性激活:对所述卷积得到的结果进行非线性激活;
重复所述反池化、卷积以及非线性激活步骤,并将每次重复后得到的结果进行结构堆叠,并根据所述结果的概率分布进行随机采样。
4.如权利要求2所述的生成方法,其特征在于,还包括根据所述最大间隔深度生成模型实现随机图片的生成,包括:
获取所述模型中的隐藏变量;
将所述隐藏变量利用所述模型的解码网络映射到与要生成的图片大小相同的第一矩阵中,所述第一矩阵的每个元素表示所述要生成的图片中每个像素的均值;
根据所述均值以及所述模型设置的图片样例像素的分布参数,对所述图片样例的每个像素进行随机采样,得到随机生成的图片。
5.如权利要求2所述的生成方法,其特征在于,还包括根据所述最大间隔深度生成模型实现图片的分类,包括:
输入需要进行分类的第一图片;
利用所述模型中的编码网络获取所述第一图片的隐藏表示;
将所述第一图片的隐藏表示映射到图片标注空间;
输出所述第一图片的类别。
6.如权利要求2所述的生成方法,其特征在于,还包括根据所述最大间隔深度生成模型实现图片缺失像素的预测,包括:
输入有像素缺失的第二图片,所述第二图片像素缺失的位置已知;
利用所述模型中的编码网络获取所述第二图片的隐藏表示;
根据所述第二图片的隐藏表示,随机采样所述第二图片的隐藏变量;
将所述第二图片的隐藏变量利用所述模型中的解码网络映射到与第二图片大小相同的第二矩阵中,所述第二矩阵的每个位置表示第二图片对应像素概率重建的均值;
将所述第二图片像素缺失的位置的像素值替换为第二概率重建均值,并将替换后的结果作为新的输入,重复进行所述获取隐藏表示、获取隐藏变量以及获取概率重建均值的步骤,所述第二概率重建均值为所述第二图片对应像素概率重建的均值。
7.如权利要求1所述的生成方法,其特征在于,所述带有标注的图片样例的集合包含在训练集合内,为所述训练集合中一个大小固定的子集。
8.如权利要求1所述的生成方法,其特征在于,所述最大间隔正则化因子,是根据所述隐藏表示以及所述图片样例的标注,通过构建线性支撑向量机得到的。
9.如权利要求1所述的生成方法,其特征在于,
所述隐藏变量分布的参数,是根据所述隐藏表示通过线性映射计算得到的;
所述隐藏变量为固定维度,是根据所述隐藏变量分布的参数,利用随机数生成器采样得到的。
10.如权利要求1所述的生成方法,其特征在于,在所述得到最大间隔深度生成模型之后,利用随机梯度下降方法优化所述模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510609808.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:边缘裂缝检测系统
- 下一篇:一种人脸识别方法和系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





