[发明专利]一种基于概率模型的多视角目标检索方法在审
申请号: | 201410745090.7 | 申请日: | 2014-12-08 |
公开(公告)号: | CN104462365A | 公开(公告)日: | 2015-03-25 |
发明(设计)人: | 刘安安;苏育挺;李希茜 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/66;G06K9/46 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 温国林 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 概率 模型 视角 目标 检索 方法 | ||
技术领域
本发明涉及多视角目标检索领域,特别涉及一种基于概率模型的多视角目标检索方法。
背景技术
人类生活在三维空间中并通过视觉感知外界信息。三维物体能够提供比文字更加生动形象的感受效果、比二维图像更加直观立体的视觉体验,因而被广泛应用于计算机制图、电脑辅助设计、医学成像等各领域。可由其多视角视图表示的三维物体,称为多视角目标。伴随着互联网技术的应用与发展,多视角目标的数目呈指数型增长[1]。如何使用户能从海量数据库中快速、准确地找到符合需求的目标,进而实现资源重用的课题吸引了众多科研工作者的目光,多视角目标检索顺理成章地成为了当下的研究热点。
多视角目标检索是基于数字图像处理、计算机视觉和机器学习等技术,借助于计算机处理技术,对数据库中物体的多视角视图进行分析比较的过程。目前,多视角目标检索技术主要分为三类:基于文本的检索、基于语义的检索以及基于内容的检索。基于文本的检索[2]通过用户使用文本关键字来标记多视角目标或场景。此方法简单高效,但其主观性和片面性较强,无法对多视角模型进行充分的描述,检索准确率不高,常出现检索失败的情况。基于语义的检索[3]是通过计算不同多视角目标的语义特征进而计算匹配概率来进行检索的。随着语义的层次越高,涉及的领域越多,计算越复杂。基于内容的检索[4]对多视角目标的视图进行预处理后提取其特征向量,通过计算特征向量之间的相似度完成检索。此方法原理简单、描述特征丰富多样且适用范围广泛。三类方法各有优劣,但由于基于内容的检索能够利用发展较成熟的二维图像处理技术而得到了广泛应用[5]。
多视角目标检索领域目前面临的主要挑战为:采集初始视图时,大多数方法对照相机的摆放角度和空间位置具有高度依赖性,导致只有当两物体的每一对应视图的角度和数目完全相同时才能进行相互检索,限制了实际应用范围。
发明内容
本发明提供了一种多视角目标检索方法,避免了采集初始视图时对摄像机空间位置信息的依赖,提高了多视角目标检索的精度,降低了计算的复杂度,详见下文描述。
一种基于概率模型的多视角目标检索方法,所述方法包括以下步骤:
(1)采集各物体的多视角彩色视图,提取掩膜后得到各物体的初始视图集,将所有物体的总视图集定义为多视角模型库;
(2)在多视角模型库中,提取各物体的初始视图集的任意视觉特征,得到初始特征向量集,将所有物体的初始特征向量集合并得到总初始特征向量集,定义为多视角特征库;
(3)从多视角模型库中随机选择一物体作为查询目标,再选取任一物体作为比较目标,检索任务为从多视角模型库中找到与查询目标相似的物体;
(4)理论分析得到基于生成式概率模型的函数,通过样本训练得到模型参数,进而计算查询目标和比较目标的匹配概率;
(5)选取多视角模型库中的下一个比较模型,重复上述步骤(2)至步骤(4),直至遍历模型库中的所有模型;
(6)将查询目标与多视角模型库中所有模型的匹配概率降序排列,得到最终的检索结果。
所述步骤(3)具体为:
采用K-means函数对查询目标和比较目标的初始特征向量集和分别聚类,将各聚类中心作为查询目标和比较目标的代表性视图的特征向量集,只使用特征向量集进行后续的匹配概率计算。
本发明提供的技术方案的有益效果是:
1、避免了采集初始视图时对摄像机空间位置信息的依赖,可以应用于任何基于视图的多视角目标数据库。即当查询物体与数据库中模型的视图数目和角度不同时,本方法依然可行;
2、采用高斯模型拟合多视角目标视图之间的匹配概率,实现了基于概率模型的多视角目标检索;
3、结合使用正负匹配样例来训练模型参数,提高了匹配精确度。
附图说明
图1为一种基于概率模型的多视角目标检索方法的流程图;
图2为物体的彩色视图样例;
图3为物体的初始视图样例;
图4为三种算法的查准-查全曲线。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步的详细描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410745090.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于用户多种行为反馈的电影推荐方法
- 下一篇:数据打包方法及装置