[发明专利]基于图像稀疏表示的抠图方法有效

专利信息
申请号: 201910917074.4 申请日: 2019-09-26
公开(公告)号: CN110766695B 公开(公告)日: 2023-08-22
发明(设计)人: 华臻;李小玲;李晋江 申请(专利权)人: 山东工商学院
主分类号: G06T7/11 分类号: G06T7/11;G06V10/762;G06V10/772
代理公司: 淄博市众朗知识产权代理事务所(特殊普通合伙) 37316 代理人: 程强强
地址: 264005 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 图像 稀疏 表示 方法
【权利要求书】:

1.一种基于图像稀疏表示的抠图方法,其特征是该方法首先构建matting图的稀疏表达字典,将图像的matting图与对应ground truth作为训练样本,从而构建出一个超完备字典,然后利用梯度信息提取图像特征,matting图像选择一阶和二阶梯度信息作为特征,ground truth图像选择高频分量作为图像块的特征,最后对KNN算法得到的matting图像,利用训练所得的稀疏字典对matting图重构来进行优化;

所述方法,还包括:

步骤1:输入目标图像以及该图像的ground truth图像;

步骤2:使用K近邻抠图(K nearest neighbors,KNN matting)算法估计初始alpha遮罩;

步骤3:利用字典训练初始估计的alpha遮罩和GT图像之间的残差;

步骤4:求解matting图像的稀疏表示系数,重建matting图像;

步骤5:字典更新,对字典的列向量逐列更新;

步骤6:对新的目标图像执行步骤2到步骤6,得到最终的matting图像;

所述步骤2中,首先提取图像的特征向量,特征向量由颜色空间和像素点的空间位置坐标组成;然后利用K近邻算法进行对图像进行特征聚类,构造拉普拉斯矩阵;再结合用户输入的trimap,求解图像的闭合形式解;

所述步骤3中,图像在过完备词典下的稀疏表示是图像离散傅立叶变换、小波变换表示形式的扩展;

所述步骤4中,统一训练matting图像块字典和ground truth图像块字典,利用梯度信息提取图像特征,matting图像选择一阶和二阶梯度信息作为特征,ground truth图像选择高频分量作为图像块的特征,对KNN算法得到的matting图像,利用训练所得的稀疏字典对matting图重构来进行优化,包括:

选择matting图像的一阶和二阶梯度信息作为特征,用来提取图像特征的4个一维滤波器定义为:

f11=[-1,0,1]

f21=[1,0,-2,0,1]

式中,T表示转置,将4个滤波器应用于matting图像的图像块,得到4个特征向量,将4个特征向量合并成1个向量作为matting图像块的特征向量,选择ground truth图像块的高频分量作为ground truth图像块的特征向量{yi},与matting图像块的特征向量合成一个向量作为稀疏编码的训练样本{xi,yi};

定义训练数据对P={Xm,Yg},Xm={x1,x2,...,xn},Yg={y1,y2,...,yn},其中,Xm为matting图像的训练数据,Yg为ground truth图像的训练数据,xi为matting图像训练图像块的向量表示,yi为ground truth图像训练图像块的向量表示,对matting图像和groundtruth图像的图像块统一进行稀疏关联学习,稀疏编码的目的就是通过对训练数据对P={Xm,Yg}的学习构建稀疏字典,将matting图像的图像块和ground truth图像的图像块统一到一个稀疏字典中,实现相同的稀疏表示,其目标函数为:

式中,M表示matting图像的图像块字典,G表示ground truth图像的图像块字典,αi表示同时满足xi在字典M和yi在字典G下的稀疏表示,η0和η为分别为第二项和第三项的拉格朗日算子,用来平衡matting图像和ground truth图像的图像块稀疏系数的稀疏性;

将上述两个训练数据集整合到一个向量中,重新构建函数:

式中,zi,P分别是matting图像和ground truth图像的图像块数据和稀疏字典的组合形式;

将matting图像训练数据与ground truth图像训练数据整合到同一个向量中,得到与一般的过完备字典形式相同的式用现有的稀疏编码算法进行稀疏字典的学习;

当matting图像的图像块字典M和ground truth图像的图像块字典G都得到后,对于每一个matting图像的训练图像块,使用OMP算法求解matting图像字典M的稀疏表示系数αi

min||α||1s.t.xi=Mαi

matting图像经过稀疏字典进行重构得到的图像,通过yi=Gαi表示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东工商学院,未经山东工商学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910917074.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top