[发明专利]获取标注数据的方法、装置、设备及存储介质在审
| 申请号: | 201811100566.6 | 申请日: | 2018-09-20 |
| 公开(公告)号: | CN109492635A | 公开(公告)日: | 2019-03-19 |
| 发明(设计)人: | 徐昀;唐继正;陈天伦;杜玉涛 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06F3/0484;G06F17/25 |
| 代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 王明远 |
| 地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标注 框选区域 存储介质 机器学习 文本框 框选 输入文本框 图片分类 文字识别 用户提供 图片 界面化 画框 场景 保存 | ||
本发明提出了一种获取标注数据的方法、装置、设备及存储介质。获取标注数据的方法包括:显示待标注的图片;基于用户在图片上执行的框选操作,确定图片上的框选区域,显示与框选区域相应的框选框,以及显示文本框;获取用户输入文本框中的文字;基于图片、框选区域的位置和尺寸以及文本框中的文字,保存用于机器学习的标注数据。本发明可以适用于但不限于OCR文字识别、图片分类、对象画框等标注场景,通过为用户提供界面化的标注平台,基于用户在所提供界面上执行的标注操作,执行与标注操作对应的操作,从而获取用于机器学习的标注数据。
技术领域
本发明总体来说涉及信息技术领域,更具体地讲,涉及一种获取标注数据的方法和装置,以及一种计算设备及一种非暂时性机器可读存储介质。
背景技术
随着信息技术和互联网的飞速发展,使得能够积累海量数据,从而能够在越来越多的场景下对数据进行利用,以使得数据更好地驱动生产、经营、生活等各种活动。例如,在人工智能领域为了进行机器学习,通常需要对这些海量数据进行标注。
尤其对于图片类型的数据而言,如何方便地获取能够满足需求的大量的标注数据,是目前亟需解决的一个问题。
发明内容
本发明的一个目的在于提供一种针对图片的标注数据获取方案。
根据本发明的第一个方面,提出了一种获取标注数据的方法,包括:显示待标注的图片;基于用户在图片上执行的框选操作,确定图片上的框选区域,显示与框选区域相应的框选框,以及显示文本框;获取用户输入文本框中的文字;基于图片、框选区域的位置和尺寸以及文本框中的文字,保存用于机器学习的标注数据。
可选地,该方法还包括:显示标签栏,以及在标签栏中显示一个或多个标签;基于用户在标签栏中执行的标签选择操作,确定所选标签;基于图片、框选区域的位置和尺寸、文本框中的文字以及所选标签,保存用于机器学习的标注数据。
可选地,在标签栏中显示一个或多个标签包括:在标签栏中用不同的颜色显示不同的标签;显示与框选区域相应的框选框包括:显示颜色与所选标签的颜色相同的框选框;并且/或者,显示文本框包括:显示颜色与所选标签的颜色相同的文本框。
可选地,基于图片、框选区域的位置和尺寸、文本框中的文字以及所选标签,保存用于机器学习的标注数据包括如下中的一种或多种:对应保存图片或其地址、框选区域的位置和尺寸、文本框中的文字以及所选标签;对应保存图片或其地址以及框选区域的位置和尺寸;对应保存图片或其地址、框选区域的位置和尺寸以及所选标签;对应保存框选区域内的图片以及文本框中的文字;对应保存框选区域内的图片、文本框中的文字以及所选标签。
可选地,在获取用户输入文本框中的文字之前,该方法还包括:对框选区域中的文本内容进行识别,得到识别结果;将识别结果作为默认文本填充到文本框内。
可选地,该方法还包括:检测用户针对文本框中默认文本执行的修改操作;基于修改操作修改文本框中默认文本。
可选地,对框选区域中的文本内容进行识别,得到识别结果包括:将框选区域内的图片输入到预训练好的识别图片中的文字的机器学习模型,得到该机器学习模型输出的识别结果。
可选地,显示文本框的步骤包括:根据框选框的尺寸、框选框与图片的相对位置关系、框选框与图片之间的留白区域的大小以及文本框的尺寸,基于预定的排版规则,确定文本框的显示位置;在所确定的显示位置处显示文本框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811100566.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于违法停车的移动执法设备
- 下一篇:基于自适应感受野深度学习的目标检测方法





