[发明专利]一种用于训练图片提纯模型的方法和装置在审
申请号: | 201710737312.4 | 申请日: | 2017-08-24 |
公开(公告)号: | CN107657269A | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 李广 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙)11370 | 代理人: | 罗朋 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 训练 图片 提纯 模型 方法 装置 | ||
技术领域
本发明涉及图像处理技术领域,尤其涉及一种用于训练图片提纯模型的技术。
背景技术
图片数据的质量提纯是获取训练数据十分关键的一步。尤其深度学习领域,绝大多数的方法都是数据驱动的,导致了图片数据的质量直接关系到了算法模型性能。因此,获取高质量的训练数据是算法研究中极为重要的一步。
目前,图片数据的提纯方法主要包括基于算法的自动挖掘的方法和利用人工标注的方法。基于算法挖掘的方法是低成本的,但效果不能保证。而人工标注的方法,虽然质量高,但成本高,周期长,尤其是海量的数据,往往有数千万级别甚至数亿张级别,人工标注的方法是不能很好满足大数据的业务需求的。
因此,如何提供一种高效、准确的训练图片提纯模型的方法,从而利用该模型来进行图片质量提纯,成为本领域技术人员亟需解决的问题之一。
发明内容
本发明的目的是提供一种用于训练图片提纯模型的方法和装置。
根据本发明的一个方面,提供了一种用于训练图片提纯模型的方法,其中,该方法包括:
a对现有图片进行图片扩容,获得扩容后的图片;
b对所述扩容后的图片进行聚类,获得对应的聚类结果;
c在至少一个聚类结果中选择预定数量的图片作为样例图片呈现给用户;
d获取所述用户基于对所述聚类结果的相关操作所得到的正、负样本;
e根据所述用户所选择的正负样本,训练对应的图片提纯模型。
优选地,步骤a包括:
根据所述用户输入的关键词,利用图片搜索引擎获得与所述关键词匹配的图片,作为所述现有图片。
优选地,步骤a包括:
获取所述用户上传的图片,作为所述现有图片。
优选地,步骤a包括:
根据所述用户输入的关键词和自所述现有图片中选择的图片,采用关键词及以图搜图的方式进行图片扩容,获得扩容后的图片。
优选地,该方法还包括:
获取所述用户设置的图片扩容的目标数量;
其中,步骤a包括:
根据所述目标数量,对所述现有图片进行图片扩容,获得扩容后的图片。
优选地,步骤d还包括:
对至少一个聚类结果进行再次聚类,并对再次聚类后获得的聚类结果选择得到正、负样本。
优选地,该方法还包括:
根据所述图片提纯模型,对大规模图片集合进行图片质量提纯。
根据本发明的另一个方面,还提供了一种用于训练图片提纯模型的装置,其中,该装置包括:
扩容装置,用于对现有图片进行图片扩容,获得扩容后的图片;
聚类装置,用于对所述扩容后的图片进行聚类,获得对应的聚类结果;
呈现装置,用于在至少一个聚类结果中选择预定数量的图片作为样例图片呈现给用户;
第一获取装置,用于获取所述用户基于对所述聚类结果的相关操作所得到的正、负样本;
训练装置,用于根据所述用户所选择的正负样本,训练对应的图片提纯模型。
优选地,所述扩容装置用于:
根据所述用户输入的关键词,利用图片搜索引擎获得与所述关键词匹配的图片,作为所述现有图片。
优选地,所述扩容装置用于:
获取所述用户上传的图片,作为所述现有图片。
优选地,所述扩容装置用于:
根据所述用户输入的关键词和自所述现有图片中选择的图片,采用关键词及以图搜图的方式进行图片扩容,获得扩容后的图片。
优选地,该装置还包括:
第二获取装置,用于获取所述用户设置的图片扩容的目标数量;
其中,所述扩容装置用于:
根据所述目标数量,对所述现有图片进行图片扩容,获得扩容后的图片。
优选地,所述第一获取装置还用于:
对至少一个聚类结果进行再次聚类,并对再次聚类后获得的聚类结果选择得到正、负样本。
优选地,该装置还包括:
提纯装置,用于根据所述图片提纯模型,对大规模图片集合进行图片质量提纯。
根据本发明的又一个方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机代码,当所述计算机代码被执行时,如上任一项所述的方法被执行。
根据本发明的再一个方面,还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如上任一项所述的方法被执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710737312.4/2.html,转载请声明来源钻瓜专利网。