[发明专利]一种基于视觉特征合成的对象识别方法在审
申请号: | 201710333754.2 | 申请日: | 2017-05-12 |
公开(公告)号: | CN107122804A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视觉 特征 合成 对象 识别 方法 | ||
1.一种基于视觉特征合成的对象识别方法,其特征在于,主要包括看不见的视觉数据合成(一);扩散正则化(二);交替优化(三);零点识别(四)。
2.基于权利要求书1所述的看不见的视觉数据合成(一),其特征在于,通过给定的语义属性来合成看不见的类的视觉特征;在训练集f’上学习一个嵌入函数:之后,可以通过以下方式推断
3.基于权利要求书2所述的映射函数,其特征在于,为了合成视觉特征,最直观的框架是学习从语义空间到视觉特征空间的映射函数:
其中,P是投影矩阵,是损失函数,Ω是其超参数λ的正则化项;
在测试之前,可以通过给定的未知实例的属性从属性空间合成看不见的视觉特征。
4.基于权利要求书2所述的协调语义空间与视觉特征空间,其特征在于,引入一个辅助隐藏空间来协调语义空间与视觉特征空间,其中可以让保留视觉和语义空间的内在数据结构信息:
其中,潜在嵌入空间从分解,从分解;和是两个投影矩阵;Ω1是对偶图。
5.基于权利要求书1所述的扩散正则化(二),其特征在于,考虑正交旋转,即QQT=I,有(I是单位矩阵);
从等式(3)中,最佳合成数据为其中首先证明旋转后总体差异不会改变;在旋转之前,是集中的,即的原始总体方差Γ为旋转Q后,有每个维度的新方差为σ′d,每个维度的方差之和为Γ′;
总体方差Γ倾向于扩展到所有的学习维度,以便恢复的真实数据分布;
根据等式(6),有在学习框架中最小化Π,找到正交旋转:
上式表明,最小化Π相当于最大化扩散标准差的总和;
扩散标准偏差和正交旋转之和的关系为:
其中,||·||2,1是矩阵的范数;根据等式(5)和(6),可以最大化从而使Π最大化;可以将等式(3)和(5)组合,扩散正则化,形成整体损失函数;
上式将重建误差从属性最小化到视觉特征,同时保留数据结构并使信息扩展到所有维度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710333754.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于数据安全的混合聚类方法
- 下一篇:一种用户聚类方法和装置