[发明专利]一种知识与数据共同驱动的人像构图指引方法及装置有效
申请号: | 202210187967.X | 申请日: | 2022-02-28 |
公开(公告)号: | CN114580521B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 孔彦;吴富章;沈思成;武延军 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06T5/00;G06T7/11;G06V10/774;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余长江 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识 数据 共同 驱动 人像 构图 指引 方法 装置 | ||
1.一种知识与数据共同驱动的人像构图指引方法,其步骤包括:
对收集到人像照片进行预处理,构建训练数据集;其中,所述对收集到人像照片进行预处理,构建训练数据集,包括:
对所述人像照片进行数据标注,标签为构图好与构图差;
对于每一标签为构图好的人像照片Isrc,生成该人像照片Isrc的外扩修复图像Iinpaint,并将所述人像照片Isrc作为修复图像Iinpaint的最佳裁剪标签,以构造伪最佳裁剪数据集Dcrop-p;
将公开的裁剪数据集中图像的最佳裁剪或是分数最高的裁剪作为最佳裁剪标签,以构造真实最佳裁剪数据集Dcrop-r;
合并所述伪最佳裁剪数据集Dcrop-p与真实最佳裁剪数据集Dcrop-r,得到最佳裁剪数据集Dcrop;其中,所述最佳裁剪数据集Dcrop中每一图像Ib的最佳裁剪标签为为图像Ib的最佳裁剪图像中一角l的坐标值,wb为该最佳裁剪图像的宽,hb为该最佳裁剪图像的高;
随机选取多个图像扰动类别Perturb=(p1,p2,p3)及扰动幅度D=(d1,d2,d3),以对每一所述图像Ib的最佳裁剪图像进行图像联合扰动,得到扰动后的子图像Ik;其中,pi代表垂直扰动、水平扰动、缩放扰动,di为对应的扰动幅度值;
将数据(Ib,Ik,Yk,Dk)作为所述训练数据集中的训练数据;其中,Yk为构图变换信息标签,Dk为图像变换幅度;
使用所述训练数据集,训练一深度卷积神经网络,得到人像构图指引模型;其中,所述深度卷积神经网络包括:语义特征提取网络和预测构图变换类别的分类网络分支、预测构图变换幅度的回归网络分支,所述预测构图变换类别的分类网络分支包括:垂直变换分类网络分支、水平变换分类网络分支和缩放变换分类网络分支;
将摄像的预览图输入所述人像构图指引模型,得到引导信息;其中,所述引导信息包括所述预览图需要变换的操作类型和变换幅度值,所述操作类型包括:上或下、左或右、和缩小或放大;
基于引导信息,变换所述预览图的构图。
2.如权利要求1所述的方法,其特征在于,所述生成该人像照片的外扩修复图像Iinpaint,包括:
1)生成一空白图像,其中所述空白图像的尺寸大小为该人像照片的α倍,α>1;
2)将该人像照片填充至一空白图像的中心,周围的空白填充为0像素,以生成该人像照片的掩码图;
3)使用图像修复算法,对所述掩码图进行四周内容修复,得到该人像照片的伪最佳裁剪图像Iinpaint。
3.如权利要求1所述的方法,其特征在于,所述语义特征提取网络包括:一轻量级神经网络MobileNetV2、一金字塔空间池化层和两层全连接层。
4.如权利要求1所述的方法,其特征在于,所述训练一深度卷积神经网络时的损失函数其中Lsj为分类网络分支的损失函数,j∈{1,2,3}且代表垂直变换分类网络、水平变换分类网络或缩放变换分类网络,L4为回归网络分支的损失函数。
5.如权利要求4所述的方法,其特征在于,分类网络分支的损失函数N代表所述训练数据集中的样本数量,C代表构图变换类别的数量,Y(i)代表第i个样本所属类别,li,Y(i)为神经网络对第i个样本在Y(i)类的全连接层输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210187967.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置