[发明专利]数据增强、处理方法和装置、电子设备和计算机存储介质在审
申请号: | 201710343304.1 | 申请日: | 2017-05-16 |
公开(公告)号: | CN108230233A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 钱晨;孙刚 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T3/20;G06T5/00;G06N99/00 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像变换方式 计算机存储介质 方法和装置 电子设备 数据增强 准确度 变换处理 网络模型 样本图像 新样本 图样 样本 图像 | ||
本发明实施例公开了一种数据增强、处理方法和装置、电子设备和计算机存储介质。其中,方法包括:从N种图像变换方式中选取T种图像变换方式,其中,N为大于1的整数,T为大于0的整数,且T≤N;对当前样本图像依次进行与所述T种图像变换方式相应的变换处理,获得新样本图像。本发明实施例可以对样本图样进行扩充,提升训练获得的网络模型识别的准确度。
技术领域
本发明属于图像预处理技术领域,特别是涉及一种样本图像数据增强方法和装置、数据处理方法和装置、电子设备和计算机存储介质。
背景技术
基于机器学习的图像识别技术,是通过对大量样本图像的训练获得具有广泛识别功能的网络模型,然而,在实际训练过程中,能够收集到的某些类别的样本图像的数量相对比较稀少,不能全面反映这些类别的信息。例如,对于同一个场景或物体,在不同光照、不同角度或不同照相机拍摄的照片会存在非常大的差异,而我们只能收集到其中在某一光照、某一角度或某一照相机拍摄的照片,作为样本图像,对网络模型进行训练。
这样,采用某些类别数量比较稀少的样本图像对网络模型进行训练,所训练出来的网络模型识别的准确度较低、实用性较差。
发明内容
本发明实施例提供一种数据增强技术方案。
根据本发明实施例的一个方面,提供一种样本图像数据增强方法,包括:
从N种图像变换方式中选取T种图像变换方式,其中,N为大于1的整数,T为大于0的整数,且T≤N;
对当前样本图像依次进行与所述T种图像变换方式相应的变换处理,获得新样本图像。
可选地,在本发明上述任一方法实施例中,还包括:
改变所述T种图像变化方式的排序;
所述对当前样本图像依次进行与所述T种图像变换方式相应的变换处理,包括:按照改变排序后的所述T种图像变换方式的顺序,依次对当前样本图像进行相应的变换处理。
可选地,在本发明上述任一方法实施例中,所述N种图像变换方式包括以下至少一项:尺寸裁剪变换、色彩增强变换、胶片暗角变换、径向畸变变换、透视变换和图像旋转变换。
可选地,在本发明上述任一方法实施例中,通过所述尺寸裁剪变换方式对当前样本图像进行变换处理,包括:
从当前样本图像中裁剪具有一定面积和形状的区域图像;
将所述区域图像的尺寸调整为所述当前样本图像的尺寸。
可选地,在本发明上述任一方法实施例中,所述从当前样本图像中裁剪具有一定面积和形状的区域图像之前,包括:
从预设面积比值范围中选取面积比值,所述面积比值为需裁剪出的图像面积与裁剪前图像面积的比值;和/或,从预设长宽比值范围中选取长宽比值,所述长宽比值为需裁剪出的图像的长度与宽度的比值;
根据所述面积比值和/或所述长宽比值,确定需裁剪出的图像的面积和/或形状。
可选地在本发明上述任一方法实施例中所述色彩增强变换包括:亮度变换、饱和度变换和对比度变换。
可选地,在本发明上述任一方法实施例中,通过所述色彩增强变换方式对当前样本图像进行变换处理,包括:
从亮度变换、饱和度变换及对比度变换中选取一种图像变换方式;
对当前样本图像进行与所选取的一种图像变换方式相应的变换处理;或者
从亮度变换、饱和度变换及对比度变换中选取至少二种图像变换方式;
对所选取的至少二种图像变换方式进行排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710343304.1/2.html,转载请声明来源钻瓜专利网。