[发明专利]一种基于主动学习技术的机器人数据收集迭代训练方法、系统以及储存介质在审

申请号：	202011533507.5	申请日：	2020-12-22
公开（公告）号：	CN112906902A	公开（公告）日：	2021-06-04
发明（设计）人：	秦豪;赵明	申请（专利权）人：	上海有个机器人有限公司
主分类号：	G06N20/00	分类号：	G06N20/00;G06K9/62
代理公司：	北京天盾知识产权代理有限公司 11421	代理人：	梁秀秀
地址：	200120 上海市浦***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于主动学习技术机器人数据收集训练方法系统以及储存介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于主动学习技术的机器人数据收集迭代训练方法、系统以及储存介质，包括如下步骤：S1、取预设比例的已标注的图片数据作为训练数据，并将剩下比例的图片数据作为测试数据；S2、建立监督深度学习模型，并用所述训练数据对深度学习模型进行训练优所述监督深度学习模型；S3、用所述测试数据对所述监督深度学习模型检测结果的置信度进行检测；S4、制定机器人收集粗略业务数据集策略，并收集的粗略业务数据集；S5、引入主动学习课程指导主动学习过程挖掘对收集的粗略业务数据中低置信度样本进行人工标注，本专利借助主动学习技术，实现了一种半监督的机器人数据收集迭代系统，大大提高了数据收集的有效性，减少了人工标注的成本。

技术领域

本发明涉及图像标注领域技术领域，尤其涉及一种基于主动学习技术的机器人数据收集迭代训练方法、系统以及储存介质。

背景技术

随着深度学习的发展，工业界越来越依赖目标检测，语义分割等监督学习技术，这类技术需要带特定标注数据作为支撑，通常来说，业务数据量越丰富，机器人目标检测识别率越高，而标注数据需要依靠有一定培训经验的人工标注，但在实际业务场景中，大批量数据的标注成本较高。

主动学习是一种通过技术手段或者数学方法来降低标注成本，提高数据集质量的一种方法，在机器人收集回放的无标签数据，运用主动学习的手段，挑选出有效的业务数据，并预打标签，再由人工审核微调标签，大大降低标注成本。

发明内容

本发明的目的之一在于，借助主动学习技术，筛选有效的业务数据，降低标注成本。

为实现上述目的，本发明提供了一种一种机器人数据收集迭代系统一种基于主动学习技术的机器人数据收集迭代训练方法，其特征在于，包括如下步骤：

S1、取预设比例的已标注的图片数据作为训练数据，并将剩下比例的图片数据作为测试数据；

S2、建立监督深度学习模型，并用所述训练数据对深度学习模型进行训练优所述监督深度学习模型；

S3、用所述测试数据对所述监督深度学习模型检测结果的置信度进行检测；

S4、制定机器人收集粗略业务数据集策略，并收集的粗略业务数据集；