[发明专利]一种基于预测结果筛选的鲁棒数字图像标注方法有效
申请号: | 201710298619.9 | 申请日: | 2017-04-27 |
公开(公告)号: | CN107122800B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 李宇峰;王少博;周志华 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210046 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 预测 结果 筛选 数字图像 标注 方法 | ||
本发明公开了一种基于预测结果筛选的鲁棒机器学习方法,用于获得更可靠的数字图像标注结果。具体而言,本发明采用机器学习中的经典思想——最大化间隔原理,对待标注的数字图像在多种相似度度量下得到的预测结果进行筛选,选取其中间隔最大的结果作为最终预测结果输出,完成对数字图像的标注。预测结果具有大间隔理论上避免了预测结果难以区分的情况,具有不错的鲁棒性。为了显示地计算间隔,本发明采用机器学习经典损失函数来衡量预测结果的区分程度,从而得到间隔的大小。其中,损失函数指预测结果(连续值)与候选的预测标记(离散值)之间的差距,该损失越小代表了预测结果的间隔越大。
技术领域
本发明涉及一种基于预测结果筛选的鲁棒数字图像标注方法,属于机器学习技术领域。
背景技术
随着各类社交网站的广泛流行以及数码产品的大量普及,每时每刻都有海量的数字图像产生并传播。要在如此大规模的图像数据上提供相关服务,一个最核心也是最困难的任务是让计算机自动理解图像的语义,而图像标注则是其中的关键技术。自动图像标注的任务是基于数字图像的视觉特征来预测其语义标记。具体而言,首先从数字图像中抽取视觉特征来表示这些图像示例,然后基于这些特征表示,从已经具有语义标记的图像数据集合中训练出一个标注模型。将待预测标记的数字图像对应的特征表示输入标注模型后,模型就能对它们的语义标记做出预测。传统的数字图像标注技术往往仅利用已经具有语义标记的图像数据,即采用监督学习的方式。然而互联网上存在着大量的原始图像数据,这些数字图像非常容易获取但本身不具有语义标记(即未标记数据)。如何有效地利用大量“便宜的”未标记数据来帮助提高标注模型的性能,具有很强的现实意义,已成为机器学习领域的一个重要研究课题,这类方法称为半监督学习方法。
尽管针对数字图像标注的任务,采用半监督学习方法通常能够取得比采用监督学习方法更好的标注性能,但依然存在性能不鲁棒的问题,甚至在某些情况下不如采用监督学习方法的性能。具体而言,针对数字图像的数据特征,图像标注任务通常采用相似相近原理——相似示例具有相似标注,构建半监督学习方法。这类方法的关键是刻画示例的相似性。因此,学习方法的性能极大地依赖于示例的相似度度量。虽然已有许多研究者提出了各种各样的度量方法,但在实际任务中,如何构建可靠的相似度度量使得半监督学习方法的性能不受损害,依然是一个开放性的问题。针对数字图像标注任务而言,至今并没有任何研究成果表明某一种相似度度量特别适于此类任务,这便导致了在实际应用中用户采用半监督学习方式来训练标注模型时面临诸多相似度度量上的选择问题,如若选择不当,将会使所得标注模型的标注能力受到极大影响,继而对用户造成损失,尤其当错误的标注会带来严重后果时,如医疗影像标注任务等,则影响更甚。因此,急需一种鲁棒的学习方法用于数字图像标注任务。
发明内容
发明目的:针对目前半监督学习方法用于数字图像标注任务时,存在性能退化的问题,本发明提供了一种基于预测结果筛选的鲁棒数字图像标注方法,用于获得更可靠的数字图像标注结果。具体而言,本发明采用机器学习中的经典思想——最大化间隔思想,对待标注的数字图像在多种相似度度量下得到的预测结果进行筛选,选取其中间隔最大的结果作为最终预测结果输出,用以完成对数字图像的标注。预测结果具有大间隔在一定程度上避免了预测结果不能区分,从而具有较高的可靠性。为了刻画间隔,本发明采用损失函数的方式衡量预测结果的间隔大小。损失函数用于计算预测值(连续值)与对应的预测标记(离散值)之间的差距,该损失越小代表了这组预测结果的间隔越大。
技术方案:一种基于预测结果筛选的鲁棒数字图像标注方法,主要包括以下一系列步骤:
(1)通过采用半监督学习方法并应用多种相似度度量,获得当前待标注图像的多组相关语义标记的预测结果;
(2)对每组预测值,应用经典损失函数计算其间隔大小;
(3)选取损失最小的一组预测值作为最终预测结果,对相应的数字图像进行标注。
附图说明
图1是数字图像标注的工作流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710298619.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于扩展形态学和导向滤波的高光谱图像分类方法
- 下一篇:图像分类的方法和装置