[发明专利]基于尺度选择的自顶向下的视觉显著性提取方法有效
申请号: | 201210425652.0 | 申请日: | 2012-10-30 |
公开(公告)号: | CN102999763A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | 张瑞;仇媛媛;朱俊;付赛男;邹维嘉;朱玉琨 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 选择 向下 视觉 显著 提取 方法 | ||
1.一种基于尺度选择的自顶向下的视觉显著性提取方法,其特征在于,包括以下两个阶段,每个阶段四个步骤:
第一阶段:训练阶段
S1:对每幅图像进行稠密采窗,对每个窗提取特征描述符;
S2:根据训练集图像得到的特征描述符构建视觉词典,然后用某一种编码方法将训练集图像的特征描述符映射为编码向量;
S3:将每一个窗作为中心窗,将之与周边的窗的编码向量做多尺度的合并,每个窗都生成新的特征向量,由于做了多尺度的融合,所以每个窗会对应多个特征向量;
S4:将不同尺度的特征向量和真实标注分别输入到支撑向量机训练,得到不同尺度的非线性模型,用于预测显著值,将预测得到的结果和真实标注用KLD做评价,取KLD值最小的尺度作为最佳尺度;
第二阶段:显著值计算阶段
S1:和训练阶段的S1相同,对每幅图像进行稠密采窗,并提取相同的特征描述符;
S2:根据已有的词典,用与训练阶段S2相同的编码方法将每幅图像每个窗内提取的特征描述符映射为编码向量;
S3:根据训练阶段S4得到的最佳尺度,将中心窗和周边窗在最佳尺度上合并,生成新的特征向量;
S4:用训练阶段得到的非线性模型对最佳尺度上的特征向量做预测得到最终的显著值。
2.根据权利要求1所述的基于尺度选择的自顶向下的视觉显著性提取方法,其特征在于,所述训练阶段中步骤S3中的多尺度向量融合的方法如下:
定义在尺度n的周边窗为:Λn=Ω1∪Ω2…∪Ωn,为尺度n上的边缘窗集合,
其中:表示f(n)的第k个分量,cj代表周边窗上的第j个编码向量,cj,k代表cj的第k个分量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210425652.0/1.html,转载请声明来源钻瓜专利网。