[发明专利]基于人机交互生成视频深度图序列的方法及系统有效
申请号: | 201110174037.2 | 申请日: | 2011-06-24 |
公开(公告)号: | CN102196292A | 公开(公告)日: | 2011-09-21 |
发明(设计)人: | 戴琼海;晏希 | 申请(专利权)人: | 清华大学 |
主分类号: | H04N13/00 | 分类号: | H04N13/00;G06K9/46;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100084 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人机交互 生成 视频 深度 序列 方法 系统 | ||
1.一种基于人机交互生成视频深度图序列的方法,其特征在于,包括以下步骤:
A1:从视频帧序列中提取出关键帧和非关键帧;
A2:对所述视频帧序列的每一帧进行图像过分割以获得多个过分割块;
A3:设置所述关键帧中的部分过分割块的深度值;
A4:根据所述部分过分割块的深度值获取所述关键帧的其余过分割块的深度值,从而获得所述关键帧的深度图;
A5:将所述关键帧和所述关键帧对应的深度图作为训练样本,通过机器学习算法获取所述非关键帧的深度图;以及
A6:对所述关键帧的深度图和所述非关键帧的深度图进行后处理,以获得最终的视频深度图序列。
2.根据权利要求1所述的方法,其特征在于,所述步骤A1具体包括:
A11:通过采用镜头检测算法中的双阈值法,检测出所述视频帧序列中的镜头切换帧和镜头渐变帧,并将所述镜头切换帧和所述镜头渐变帧作为关键帧,其余帧作为非关键帧;以及
A12:对步骤A11的检测结果进行人工修正。
3.根据权利要求1所述的方法,其特征在于,所述步骤A2中的过分割采用基于K均值聚类的方法。
4.根据权利要求1所述的方法,其特征在于,所述步骤A3具体包括:
用户在原图像上勾划出多条灰度曲线,其中每条曲线的灰度值代表该条曲线所经过的过分割块的深度值。
5.根据权利要求1所述的方法,其特征在于,所述步骤A4具体包括:
A41:将已指定深度值的过分割块的深度值的置信度设为1,将其余过分割块的深度值以及深度值的置信度均设为0;
A42:计算每两个相邻的过分割块在颜色和纹理上的相似性度量;
A43:开始进行迭代,在每轮迭代中,根据以下的公式更新过分割块i的深度值,
其中,Dt+1(i)表示分割块i在第t+1轮迭代后的深度值,N(i)表示由过分割块i以及所有和它相邻的过分割块所构成的集合,Dt(j)表示分割块j在第t轮迭代后的深度值,权重其中Sji为过分割块i和过分割块j在颜色和纹理上的相似性度量,为过分割块j在第t轮迭代后的深度值的置信度;
A44:在每轮迭代后,将过分割块i的深度值的置信度ci更新为此轮迭代中权重wji的最大值;以及
A45:重复步骤A43和A44,直至过分割块的深度值不发生变化或者迭代次数达到了给定的阈值;以及
A46:根据所述关键帧中所有过分割块的深度值生成关键帧的深度图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110174037.2/1.html,转载请声明来源钻瓜专利网。