[发明专利]低秩约束的在线自监督学习的场景分类方法有效
| 申请号: | 201210429630.1 | 申请日: | 2012-10-31 |
| 公开(公告)号: | CN103793713B | 公开(公告)日: | 2017-09-15 |
| 发明(设计)人: | 丛杨;宋红玉;唐延东 | 申请(专利权)人: | 中国科学院沈阳自动化研究所 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/66 |
| 代理公司: | 沈阳科苑专利商标代理有限公司21002 | 代理人: | 周秀梅,许宗富 |
| 地址: | 110016 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 约束 在线 监督 学习 场景 分类 方法 | ||
技术领域
本发明涉及一种场景自动分类方法,具体地说是通过低秩约束的在线自监督学习的场景分类方法。
背景技术
当今社会,机器学习技术在许多有着视觉认知能力的实际系统中扮演着一个核心的角色。传统上,机器学习模型是由标记训练数据离线训练的,在整个在线程序中都是固定不变的,例如我们例子中场景分类的机器视觉系统。不幸的是,对于实际的在线视觉系统,模型的性能可能会随着时间推移恶化并且新数据可能会与初始化训练数据大相径庭。为了处理这些问题,模型必须在批处理模式下由已有数据和新数据再离线训练一次,这样做将会很耗时间。更严重的是,如果数据集的体积过大,批训练模型将很难处理每次迭代中的所有数据。
为了克服这个缺点,一次学习一个或者一组例子的在线模型将提供一个有效的方法替代离线再训练,这是通过增量更新分类器知识的新来数据并且建立一个适应不断变化数据的决定边界。通过提供矩阵形式的模型专注于自适应相似度学习者,例如度量学习、协同滤波和多任务学习。在线度量学习模型目的是学习一个半正定矩阵W∈Rd×d,因此对于所有的p1,p2,p3∈Rd有成立;如果p1,p2很相似而p1,p3刚好相反,为了分类应p1,p2该来自同一类而p3则是来自另一类。从本质上讲,监督在线度量学习者也是以最大边界区分特征点的。如果所有d维数据在一个小维的子空间中,如果数据是可区分的秩小于r的度量矩阵就能够区分任意的两个样本。从理想上说,许多秩大于r的度量矩阵能够区分没有任何噪音的数据。然而,在实际中数据总会包含噪音,于是高秩度量矩阵会引起过拟合并会因此使度量矩阵容易受噪音和干扰影响。
发明内容
针对现有技术的不足,本发明提供一种结合在线度量学习和半监督标签传播的分类方法,所采用的技术方案是:低秩约束的在线自监督学习的场景分类方法,包括以下步骤:
对离线图像数据进行训练并进行特征提取;进行小批训练来获得一个最初的度量学习者W0;
依次输入在线数据图像qi并提取图像特征;判断图像特征有无标签;
如果有标签,则更新度量学习者Wi,返回依次输入在线数据图像qi步骤;
如果无标签,则测量该图像与已测的每个有标签训练样本之间的相似度,利用相似度生成的双向线性图来传播它的标签;然后判断该图像特征向量与样本的特征向量相似度Sw得分;
如果得分在设定值范围内,则将该图像q插入到队列Q中,当队列Q满时更新Q,然后转至更新度量学习者步骤,同时将Q插入到P类中并清零,此时度量学习者为最终的度量学习者,P类为最终的类。
所述度量学习者为低秩矩阵。
所述最初的度量学习者为单位矩阵W0=Id×d,d为矩阵的维数,I为单位矩阵。
所述更新度量学习者包括以下步骤:
从在线图像数据的指数集合T中均匀采样得到一个随机指数t;
将t代入度量学习者迭代公式
其中其中Wi=I∈Rd×d,γ为一预设的值,αi为步长,P(W)=||W||*,Ω={W|W≥0},表示与pt相似的样本,表示与pt不相似的样本,t为随机指数,l(W,t)为铰链损失函数
令i=i+1,再返回从在线图像数据的指数集合T中均匀采样得到一个随机指数t步骤。
所述测量图像与每个训练样本之间的相似度采用参数化的相似函数其中pi,pj∈Rd,分别为所测在线图像特征向量和有标签的样本图像特征向量,Sw值表示特征向量相似度。
所述利用该双向线性图来传播它的标签包括以下步骤:
6-1.用相似函数生成双线性图表:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院沈阳自动化研究所,未经中国科学院沈阳自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210429630.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种圆形二维条码及其编码解码方法
- 下一篇:生物特征识别装置和电子设备





