[发明专利]基于内镜图像对机器学习模型进行训练的方法、装置和存储介质有效
| 申请号: | 201911397441.9 | 申请日: | 2019-12-30 |
| 公开(公告)号: | CN111126574B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 王晓宁;孙钟前;付星辉;尚鸿;郑瀚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/764;G06V10/774;G06N3/0464;G06N3/08 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 孙之刚;申屠伟进 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图像 机器 学习 模型 进行 训练 方法 装置 存储 介质 | ||
1.一种用于对机器学习模型进行训练的方法,其特征在于至少包括下述步骤:
第一阶段:
-输入未标注图像样本集;
-基于经初始化或经预训练的所述机器学习模型通过主动学习从所述未标注图像样本集中选择待标注图像样本;
-对所述待标注图像样本进行标注,并将经标注的图像样本存储在标注数据集中;
-将所述标注数据集划分为训练数据集和验证数据集;
-使用所述训练数据集对所述机器学习模型进行训练,得到经训练的机器学习模型;
-使用所述验证数据集对所述经训练的机器学习模型进行验证,得到所述经训练的机器学习模型的性能;以及
第二阶段:
-在所述经训练的机器学习模型的性能小于预定性能指标时,重复所述第一阶段中的步骤;直到所述经训练的机器学习模型的性能大于等于所述预定性能指标;
其中,在所述第二阶段的主动学习中使用下述策略中的任一项或其任意组合从所述未标注图像样本集中选择所述待标注图像样本:
i)基于所述机器学习模型对所述未标注图像样本中的每个未标注图像样本进行预测,得到针对所述每个未标注图像样本的预测结果,并在所述预测结果针对分类任务中每个分类类别的分类预测概率在预定范围内时,选择所述未标注图像样本作为所述待标注图像样本;
ii)对所述未标注图像样本中的每个未标注图像样本进行数据增强,得到所述每个未标注图像样本的多个增强变型,基于所述机器学习模型对所述每个未标注图像样本的多个增强变型进行预测,得到针对所述每个未标注图像样本的多个增强变型的多个预测结果,并在所述多个预测结果中相同预测结果小于预定比例时,选择所述未标注图像样本作为所述待标注图像样本;
iii)基于所述机器学习模型对所述标注数据集中的每个标注图像样本进行预测,得到所述每个标注图像样本在所述机器学习模型的最后一个卷积层的特征向量,计算所述标注数据集中的每个标注图像样本的最后一个卷积层的特征向量的均值LDc({0,1,…,N}),其中c表示所述分类任务的分类类别,N表示所述分类任务的分类类别总数;基于所述机器学习模型对所述未标注图像样本中的每个未标注图像样本进行预测,得到所述每个未标注图像样本在所述机器学习模型的最后一个卷积层的特征向量ULDi以及分类类别的预测结果Pi,Pi{0,1,…,N};并计算LDPi与各个ULDi的相似度,选择预定数量的相似度较小的图像样本作为所述待标注图像样本。
2.根据权利要求1所述的方法,其特征在于,在所述第一阶段的主动学习中使用下述策略中的任一项或二者的组合从所述未标注图像样本集中选择所述待标注图像样本:
i)基于所述机器学习模型对所述未标注图像样本中的每个未标注图像样本进行预测,得到针对所述每个未标注图像样本的预测结果,并在所述预测结果针对分类任务中每个分类类别的分类预测概率在预定范围内时,选择所述未标注图像样本作为所述待标注图像样本;
ii)对所述未标注图像样本中的每个未标注图像样本进行数据增强,得到所述每个未标注图像样本的多个增强变型,基于所述机器学习模型对所述每个未标注图像样本的多个增强变型进行预测,得到针对所述每个未标注图像样本的多个增强变型的多个预测结果,并在所述多个预测结果中相同预测结果小于预定比例时,选择所述未标注图像样本作为所述待标注图像样本。
3.根据权利要求1所述的方法,其中所述计算LDPi与各个ULDi的相似度是通过计算LDPi与各个ULDi之间的余弦距离进行的。
4.根据权利要求1或2所述的方法,其中所述数据增强至少包括对所述图像的翻转、旋转、平移和缩放。
5.根据权利要求1或2所述的方法,其中所述将所述标注数据集划分为训练数据集和验证数据集包括:按照预定比例将所述标注数据集划分为训练数据集和验证数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911397441.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:歌曲演唱方法、装置、终端及存储介质
- 下一篇:隧道上部溶洞的处理方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





