[发明专利]针对图像识别模型的增强训练方法及装置有效
| 申请号: | 202011054451.5 | 申请日: | 2020-09-29 |
| 公开(公告)号: | CN112101294B | 公开(公告)日: | 2022-08-09 |
| 发明(设计)人: | 徐文浩 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V40/40;G06T5/00;G06N3/04;G06N3/08;G06Q20/40;G06V10/82 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 针对 图像 识别 模型 增强 训练 方法 装置 | ||
本说明书实施例提供一种针对图像识别模型的增强训练方法,从第一样本集中随机选择预定数量或预定比例的样本作为种子样本,进行扩展,得到若干扩展样本。其中扩展样本在原有图像的基础上添加扰动,而标注结果不变。样本扩展过程中,扰动值以基准像素为参考,向四周呈预定分布,从而可以很好地模拟真实扰动。由于扩展样本在添加扰动后标注结果不变,经过扩展样本训练的图像识别模型可以很好地识别本来的图像的目标识别结果,从而提高图像识别模型的鲁棒性。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及图像扰动处理、图像样本扩展以及利用扩展样本对图像识别模型进行增强训练的方法及装置。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别广泛应用于多种领域,例如无人驾驶、考勤、支付认证、刑侦追踪等等。其中,在一些业务场景下,除了目标检测,还需要识别相关目标是否真实目标实体,例如在人脸支付认证场景下,从用户资金安全性考虑,为了避免使用人脸照片冒充真实的人进行支付,还需要确定人脸图像是否为活体图像。
这种情况下,如果图像识别模型仅使用标准训练样本进行训练,那么在增加图像干扰的情况下,图像识别结果的准确度可能会降低,造成一定的困扰,例如人脸支付认证业务场景下的资金安全性无法保证。因此,如何提高图像识别模型的鲁棒性,至关重要。
发明内容
本说明书一个或多个实施例描述了一种图像扰动、扰动图像样本生成以及利用生成的扰动样本对图像识别模型的增强训练方法及装置,用以解决背景技术提到的一个或多个问题。
根据第一方面,提供一种针对图像识别模型的增强训练方法,包括:从第一样本集中随机选择预定数量或预定比例的样本作为种子样本,其中,各个种子样本分别对应有各个种子图像以及针对相应种子图像的标注结果;对各个种子样本分别获取基于扩展操作得到的若干扩展样本,其中,对于单个种子样本的扩展操作包括:对于所述单个种子样本对应的单个种子图像,至少在一个图像通道上,对各个像素分别融合以基准像素为中心呈预定分布排列的各个扰动值,得到单个扰动图像,其中,所述预定分布与各个像素到基准像素的距离相关;基于所述单个扰动图像与所述单个种子样本对应的标注结果构成单个扩展样本,所述基准像素按照预定规则确定;基于所述扩展样本对所述图像识别模型进行增强训练。
根据一个实施例,所述对于所述单个种子样本对应的单个种子图像,至少在一个图像通道上,对各个像素分别融合以基准像素为中心呈预定分布排列的各个扰动值,得到单个扰动图像,包括:构建与所述单个种子图像像素排列一致的掩膜图像;根据预定规则在所述掩膜图像上确定对应于预定的基准扰动值且与所述基准像素对应的基准点;在所述掩膜图像上,以所述基准点为中心,向周围各个像素按照所述预定分布,生成由所述基准扰动值依次衰减或依次增强的各个扰动值,得到第一噪声图像;基于所述第一噪声图像向所述单个种子图像的第一图像通道的融合结果,得到第一扰动图像。
根据一个实施例,所述预定分布为线性分布或正态分布。
根据一个实施例,所述第一噪声图像向所述单个种子图像的第一图像通道的叠加结果包括,根据预定权重,对所述第一噪声图像上的各个扰动值和所述第一图像通道的各个图像值,按照像素一一对应加权平均得到的结果。
根据一个实施例,所述第一扰动图像中,还包括:所述第一噪声图像向所述单个种子图像的第二图像通道的叠加结果;或者,其它噪声图像向所述单个种子图像的第二图像通道的叠加结果。
根据一个实施例,所述单个种子图像包括第一像素,所述第一像素与所述基准像素的距离为,以所在行和列为坐标,所述第一像素与所述基准像素的欧氏距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011054451.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种识别LED屏幕异常灯点的方法及装置
- 下一篇:氘代芴类化合物及其发光器件
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





