[发明专利]信息处理方法和装置以及信息检测方法有效
| 申请号: | 201710970935.6 | 申请日: | 2017-10-18 |
| 公开(公告)号: | CN109685087B9 | 公开(公告)日: | 2023-02-03 |
| 发明(设计)人: | 沈伟;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;李彦丽 |
| 地址: | 日本神*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息处理 方法 装置 以及 信息 检测 | ||
公开了一种信息处理方法和装置以及信息检测方法和装置,其中信息处理方法包括:从训练集中抽取对应于相同的语义特征的三幅图像,所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像;通过变分自编码器获得三幅图像的与语义特征对应的隐变量的分布;以及对于所述三幅图像中的每幅图像,通过使损失函数最小化来更新变分自编码器的参数,其中损失函数与第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离正相关,与第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离负相关。根据本公开的实施例,可以提取具有区分度的面部语义特征。
技术领域
本公开涉及信息处理领域,具体涉及能够提取具有区分度的面部语义特征的信息处理方法和装置以及信息检测方法和装置。
背景技术
近年来在图像生成方面取得了显著进步。出现了诸如生成式对抗网络 (GAN)和变分自编码器(VAE)的模型来生成图像。然而,GAN模型以随机噪声作为输入,并且不具有将图像编码到隐空间的能力。VAE可以将图像编码到隐空间,然而该隐空间缺乏语义含义。即,这些模型不能提取具有区分度的面部语义特征。
发明内容
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
鉴于以上问题,本公开的目的是提供能够提取具有区分度的面部语义特征的信息处理方法和装置以及信息检测方法和装置。
根据本公开的一方面,提供了一种信息处理方法,包括:可以从训练集中抽取对应于相同的语义特征的三幅图像,所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像;可以通过变分自编码器获得三幅图像的与语义特征对应的隐变量的分布;以及可以对于所述三幅图像中的每幅图像,通过使损失函数最小化来更新变分自编码器的参数,其中损失函数与第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离正相关,与第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离负相关。
根据本公开的另一方面,提供了一种信息处理装置,包括:抽取图像的单元,可以被配置成从训练集中抽取对应于相同的语义特征的三幅图像,其中,所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像;获得隐变量分布的单元,可以被配置成通过变分自编码器获得所述三幅图像的与语义特征对应的隐变量的分布;以及更新参数的单元,可以被配置成对于所述三幅图像中的每幅图像,通过使损失函数最小化来更新变分自编码器的参数,其中损失函数与第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离正相关,与第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离负相关。
根据本公开的又一方面,提供了一种信息检测方法,包括:可以将多幅图像分别输入到经训练的变分自编码器,以获得每幅图像的与语义特征对应的隐变量的分布,并且获得每幅图像的重建图像,其中,对于所述多幅图像中的具有相同的语义特征的三幅图像,所述三幅图像包括在语义特征方面具有相同语义特征值的第一图像和第二图像以及其语义特征值不同于第一图像和第二图像的第三图像,第一图像的隐变量的分布和第二图像的隐变量的分布之间的第一距离小于第一图像的隐变量的分布和第三图像的隐变量的分布之间的第二距离。
根据本公开的其它方面,还提供了用于实现上述根据本公开的方法的计算机程序代码和计算机程序产品以及其上记录有该用于实现上述根据本公开的方法的计算机程序代码的计算机可读存储介质。
在下面的说明书部分中给出本公开实施例的其它方面,其中,详细说明用于充分地公开本公开实施例的优选实施例,而不对其施加限定。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710970935.6/2.html,转载请声明来源钻瓜专利网。





