[发明专利]一种基于视觉特征合成的对象识别方法在审
申请号: | 201710333754.2 | 申请日: | 2017-05-12 |
公开(公告)号: | CN107122804A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 特征 合成 对象 识别 方法 | ||
技术领域
本发明涉及对象识别领域,尤其是涉及了一种基于视觉特征合成的对象识别方法。
背景技术
对象识别是计算机视觉领域最基础的任务之一,也是难点问题之一。对象识别包括分类和检测两项任务,分类用于判断一幅图像是否包含某类对象,检测则要求标出这些对象的位置和大小。按照描述的概念筛选搜集到的视觉元素,合成视觉特征,用于对象识别。对象识别是理解图像和场景的关键,具有广泛的应用前景,可用于Web图像自动标注、海量图像搜索、图像内容过滤、机器人、安全监视、医学远程会诊等多种领域。对象识别面临很多困难,大多数常规框架,例如深层神经网络(DNN)依靠大量的训练样本来构建统计模型,训练样本的成本太高,而且为了训练而建立一个特定的模型不太现实,收集罕见的实例也很困难。
本发明提出了一种基于视觉特征合成的对象识别方法,先通过给定的语义属性来合成看不见的类的视觉特征,再扩散正则化,形成整体损失函数,保留数据结构并使信息扩展到所有维度,接着通过使用交替优化获得局部最优解,最后在获得嵌入矩阵后从语义属性中合成看不见类的视觉特征,应用监督分类器分类。本发明提出的零点学习框架,可以在不获取真实图像的情况下,对未看到的类进行视觉特征的合成;不仅扩大了分类设置,而且使得各种信息能对视觉系统进行辅助,提高了整体性能,进一步降低合成数据的成本。
发明内容
针对训练样本的成本太高等问题,本发明的目的在于提供一种基于视觉特征合成的对象识别方法,先通过给定的语义属性来合成看不见的类的视觉特征,再扩散正则化,形成整体损失函数,保留数据结构并使信息扩展到所有维度,接着通过使用交替优化获得局部最优解,最后在获得嵌入矩阵后从语义属性中合成看不见类的视觉特征,应用监督分类器分类。
为解决上述问题,本发明提供一种基于视觉特征合成的对象识别方法,其主要内容包括:
(一)看不见的视觉数据合成;
(二)扩散正则化;
(三)交替优化;
(四)零点识别。
其中,所述的看不见的视觉数据合成,通过给定的语义属性来合成看不见的类的视觉特征;在训练集f’上学习一个嵌入函数:之后,可以通过以下方式推断
进一步地,所述的映射函数,为了合成视觉特征,最直观的框架是学习从语义空间到视觉特征空间的映射函数:
其中,P是投影矩阵,是损失函数,Ω是其超参数λ的正则化项;
在测试之前,可以通过给定的未知实例的属性从属性空间合成看不见的视觉特征。
进一步地,所述的协调语义空间与视觉特征空间,引入一个辅助隐藏空间来协调语义空间与视觉特征空间,其中可以让保留视觉和语义空间的内在数据结构信息:
其中,潜在嵌入空间从分解,从分解;和是两个投影矩阵;Ω1是对偶图。
其中,所述的扩散正则化,考虑正交旋转,即QQT=I,有(I是单位矩阵);
从等式(3)中,最佳合成数据为其中首先证明旋转后总体差异不会改变;在旋转之前,是集中的,即的原始总体方差Γ为旋转Q后,有每个维度的新方差为σ′,每个维度的方差之和为Γ′;
总体方差Γ倾向于扩展到所有的学习维度,以便恢复的真实数据分布;
根据等式(6),有在学习框架中最小化Π,找到正交旋转:
上式表明,最小化Π相当于最大化扩散标准差的总和;
扩散标准偏差和正交旋转之和的关系为:
其中,||·||2,1是矩阵的l2,1范数;根据等式(5)和(6),可以最大化从而使Π最大化;可以将等式(3)和(5)组合,扩散正则化,形成整体损失函数;
上式将重建误差从属性最小化到视觉特征,同时保留数据结构并使信息扩展到所有维度。
其中,所述的交替优化,通过使用交替优化获得局部最优解,Q=I和P的初始化可以通过获得。
进一步地,所述的-步骤,通过固定P和Q,可以最小化等式(7):
其中,额外项是根据等式(4)约束的的集中式;
最小可以通过将等式(10)的偏导数设置为零得到,如上式所示。
进一步地,所述的-步骤,通过固定P和可以最小化等式(7):
需要用等式(10)的正交约束求解Q;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710333754.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于数据安全的混合聚类方法
- 下一篇:一种用户聚类方法和装置