[发明专利]一种训练样本获得方法、装置、电子设备和存储介质有效
申请号: | 201910107568.6 | 申请日: | 2019-02-02 |
公开(公告)号: | CN109753975B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 徐青松;李青 | 申请(专利权)人: | 杭州睿琪软件有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N20/00 |
代理公司: | 上海思捷知识产权代理有限公司 31295 | 代理人: | 王宏婧 |
地址: | 310053 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 样本 获得 方法 装置 电子设备 存储 介质 | ||
本发明提供了一种训练样本获得方法、装置、电子设备及存储介质,方法包括:获得视频中的场景片段;在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中的所述目标对象所在的目标区域进行标注;提取所述初始帧中被标注的所述目标区域的特征信息;以所述初始帧为基准,对所述场景片段中前向和/或后向的视频帧进行特征搜索,确定各个被搜索帧中特征信息与所述目标区域的特征信息相匹配的区域,并对各个被搜索帧中所确定的区域进行自动标注;提取所述场景片段中已标注的各个视频帧的图像作为训练样本。本发明可以解决现有技术中获取图像训练样本效率低、成本高的问题。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种训练样本获得方法、装置、电子设备和计算机可读存储介质。
背景技术
人工智能识别模型的建立需要大量训练样本进行训练,训练样本一般为图片格式。然而,为满足训练要求,通常需要获取大量的图片作为训练样本,并且在进行标注时,需要分别对每张图片进行目标标注,效率较低、成本也比较高。
发明内容
本发明的目的在于提供一种训练样本获得方法、装置、电子设备和计算机可读存储介质,以解决现有技术中获取图像训练样本效率低、成本高的问题。
为解决上述技术问题,本发明提供了一种训练样本获得方法,包括:
获得视频中的场景片段;
在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中的所述目标对象所在的目标区域进行标注;
提取所述初始帧中被标注的所述目标区域的特征信息;
以所述初始帧为基准,对所述场景片段中前向和/或后向的视频帧进行特征搜索,确定各个被搜索帧中特征信息与所述目标区域的特征信息相匹配的区域,并对各个被搜索帧中所确定的区域进行自动标注;
提取所述场景片段中已标注的各个视频帧的图像作为训练样本。
可选的,所述获得视频中的场景片段,包括:
若所述视频为单场景视频,则将所述视频作为一个场景片段;
若所述视频为多场景视频,则利用场景切换检测技术,将所述视频划分为多个场景片段。
可选的,所述场景切换检测技术包括:基于像素域的检测算法、基于压缩域的检测算法。
可选的,在所述提取所述初始帧中被标注的所述目标区域的特征信息之前,还包括:
对所述初始帧进行图像预处理,以使所述初始帧中所述目标区域的特征信息更加明显。
可选的,所述目标区域的特征信息,包括:颜色特征、纹理特征和形状特征中的一种或多种。
可选的,所述对所述场景片段中前向和/或后向的视频帧进行特征搜索,包括:
利用均值漂移算法、Kalman滤波算法或粒子滤波算法,对所述场景片段中前向和/或后向的视频帧进行特征搜索。
可选的,所述方法还包括:
如果某一被搜索帧中不存在特征信息与所述目标区域的特征信息相匹配的区域,则获取目标特征信息,确定该被搜索帧中特征信息与所述目标特征信息相匹配的区域,并对该被搜索帧中所确定的区域进行自动标注;
其中,所述目标特征信息为:该被搜索帧的相邻预设数量帧中已被标注区域的特征信息。
本发明还提供一种训练样本获得装置,包括:
获得模块,用于获得视频中的场景片段;
第一标注模块,用于在所述场景片段中选择一个包含目标对象的视频帧作为初始帧,对所述初始帧中的所述目标区域进行标注;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州睿琪软件有限公司,未经杭州睿琪软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910107568.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:物体旋转角度的检测方法、装置及电子设备
- 下一篇:语料标注装置和方法