[发明专利]视频数据标注方法、系统、获取神经网络深度学习的数据源的方法及计算机可读存储介质有效
申请号: | 202110231619.3 | 申请日: | 2021-03-02 |
公开(公告)号: | CN112966588B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 何涛;黄安棋;金振豪;陈云妹 | 申请(专利权)人: | 南昌黑鲨科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/82;G06V20/70;G06N3/08 |
代理公司: | 上海雍灏知识产权代理事务所(普通合伙) 31368 | 代理人: | 沈汶波 |
地址: | 330013 江西省南昌市经济技术开发区玉屏东大街2*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 数据 标注 方法 系统 获取 神经网络 深度 学习 数据源 计算机 可读 存储 介质 | ||
本发明提供了一种视频数据标注方法、系统、获取神经网络深度学习的数据源的方法及计算机可读存储介质,通过人工标注视频内的少量的核心数据,以这些核心帧的数据为基础,通过分界时刻点的数据标注拓展到整个区间段,以完成整段区间内的数据标记;再针对区间内的递增递减规律,进一步完成动态的被标注对象的信息采集记录,获取所述标注源数据,极大提高了人工标注的速度。并且将视频数据标注方法所获取的最终标注数据作为用于获取神经网络深度学习的数据源,可克服现有技术的人工标注数据效率低、样本数据量少等问题。
技术领域
本发明涉及数据标注技术领域,尤其涉及一种视频数据标注方法、系统、获取神经网络深度学习的数据源的方法及计算机可读存储介质。
背景技术
深度学习(Deep Learning)需要大量精细化标注的数据素材用于神经网络训练。目前获取数据的方法主要有三种:人工数据标注、自动数据标注、外包数据标注。人工标注可以得到较高可信度的数据,受限于人力资源以及需要巨大的数据基数,单纯的人工标注注定无法完成如此庞大的数据清洗。目前也有很多比较实用的客户端、WEB端的数据标记工具,极大的减轻了劳动力,同时也带来一些信息安全的风险。
发明内容
为了克服上述技术缺陷,本发明的目的在于提供一种数据标注效率高、样本数据量大的视频数据标注方法、系统、获取神经网络深度学习的数据源的方法及计算机可读存储介质。
本发明公开了一种视频数据标注方法,包括如下步骤:人工标注目标视频内的部分数据,编写需要关注对象的内容与视频时间对齐的文本;通过计算机编程编写脚本将目标视频按照每秒n帧的速度分裂成图片,以时间戳命名所述图片的名称,根据所述时间戳获取每张图片所处的时间区间;依据所述文本内的内容,通过计算机编程编写脚本为每张图片生成描述性文件,所有图片的所述描述性文件组成所述目标视频的标注源数据;通过训练模型筛选出所述标注源数据中的异常图片,并通过人工审核确定所述异常图片,剔除所述异常图片后形成初始标注数据;剔除所述初始标注数据的重复图片,形成最终标注数据。
优选地,所述人工标注目标视频内的部分数据,编写需要关注对象的内容与视频时间对齐的文本包括:人工浏览目标视频一次性标注部分数据,坐标位置不变,被标记坐标的内容填写默认值,获得所有需要标记对象和分界点帧信息;浏览目标视频、关注需要标记对象的内容变化,并根据视频时间对齐标注该标记对象的内容,以形成需要关注对象的内容与视频时间对齐的TXT文本。
优选地,所述通过训练模型筛选出所述标注源数据中的异常图片,并通过人工审核确定所述异常图片,剔除所述异常图片后形成初始标注数据包括:标注源数据的内容形式是文字、数字、实物照,通过训练模型对所述标注源数据进行识别得到识别结果;筛选出识别结果与标注内容不一致的异常图片;通过人工审核确定所述异常图片;剔除所述异常图片后,通过编写Python可视化插件将所述标注源数据重新分类形成初始标注数据。
优选地,所述通过训练模型筛选出所述标注源数据中的异常图片,并通过人工审核确定所述异常图片,剔除所述异常图片后形成初始标注数据还包括:标注源数据的内容形式是文字、数字、实物照以外的新内容,则随机取所述标注源数据内的部分数据记为Data0,其余部分记为Data1;将Data0分类训练成第一训练模型,使用所述第一训练模型挑选Data1,经人工审核修正后的Data1分类训练成第二训练模型,使用所述第二训练模型挑选Data0,如此多次迭代形成所述初始标注数据。
优选地,所述剔除所述初始标注数据的重复图片,形成最终标注数据包括:计算所述初始标注数据的图片的Phash值,获取不同图片之间的汉明值,从而去掉重复图片,形成最终标注数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌黑鲨科技有限公司,未经南昌黑鲨科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110231619.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浅海区海洋生物养殖结构
- 下一篇:基于机器学习的恶意文件检测方法及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置