[发明专利]一种图像数据集辅助标记系统及方法在审
申请号: | 201810734583.9 | 申请日: | 2018-07-06 |
公开(公告)号: | CN108898188A | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 姜柏帆;张岚;程平;杨正军 | 申请(专利权)人: | 四川奇迹云科技有限公司;四川虹电数字家庭产业技术研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 邹敏菲;吴静宜 |
地址: | 610000 四川省成都市中国(四川)自由贸易*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据集 神经网络训练 图像数据集 辅助标记 费力 标签 图像数据预处理 图像 神经网络 特征提取 图像信息 文档格式 文档 | ||
1.一种图像数据集辅助标记系统,其特征在于,包括图像获取模块、图像特征提取模块、数据集扩充模块、图像识别定位模块、防错检查模块和文档生成模块;
所述图像获取模块:获取样本图像数据库以及目标图像数据库;
所述图像特征提取模块:获取图像获取模块所发送的样本图像数据库并提取得到样本图像特征,并获取图像获取模块所发送的目标图像数据库并提取得到目标图像特征;
所述图像识别定位模块:获取图像特征提取模块所发送的样本图像特征并训练得到图像识别分类器,根据识别分类器对图像特征提取分类后的目标图像特征识别定位;
所述数据集扩充模块:接收图像识别定位模块所输出的目标图像数据库并扩充得到目标图像数据集;
所述防错检查模块:接收并检查数据集扩充模块所输出的目标图像数据集并检查是否有错误的目标图像,若有,则将目标图像返回至图像识别定位模块继续识别定位,若无,则输出准确目标图像数据集;
所述文档生成模块:接收防错检查模块所输出的准确目标图像数据集并生成标签文档格式。
2.一种图像数据集辅助标记方法,其特征在于,包括以下步骤:
步骤1:获取样本图像数据库以及目标图像数据库;
步骤2:获取样本图像数据库并提取得到样本图像特征,并获取目标图像数据库并提取得到目标图像特征;
步骤3:获取样本图像特征并训练得到图像识别分类器,根据识别分类器对图像特征提取分类后的目标图像特征识别定位;
步骤4:接收步骤3所输出的标记的目标图像数据库并扩充得到目标图像数据集;
步骤5:接收并检查目标图像数据集并检查是否有错误的目标图像,若有,则将目标图像返回至步骤4继续识别定位,若无,则输出准确目标图像数据集;
步骤6:接收准确目标图像数据集并生成标签文档格式。
3.如权利要求2所述的一种图像数据集辅助标记方法,其特征在于,所述步骤3的具体步骤为:
步骤3.1:利用神经网络对样本图像特征训练得到图像识别分类器;
步骤3.2:利用图像识别分类器对目标图像特征识别定位得到边界框信息包括label,x,y,w,h,label代表该类分类的名称,x代表识别定位框左上角横坐标的像素值,y代表识别定位框左上角纵坐标的像素值,w指的是定位框的宽度,h指的是定位框的高度。
4.如权利要求3所述的一种图像数据集辅助标记方法,其特征在于,所述步骤4的具体步骤为:
步骤4.1:获取标记的目标图像数据库,边界框信息坐标为(x,y,w,h);
步骤4.2:图像的中心点作为坐标原点,根据识别框坐标得到标记的目标图像ABCD坐标位置以及识别框EFGH的坐标;
步骤4.3:对标记的目标图像ABCD中的坐标点旋转θ,线性变换得到变换后的目标图像A’B’C’D’;
步骤4.4:获取4.3做线性变换后的目标图像A’B’C’D’,得到扩充后的目标图像数据集。
5.如权利要求4所述的一种图像数据集辅助标记方法,其特征在于,还包括步骤4.5:对步骤4.4所获得的目标图像数据集中的图像和边界框补全。
6.如权利要求5所述的一种图像数据集辅助标记方法,其特征在于,补全后的图像A”B”C”D”边界以及边界框都需要分别平行于坐标轴;
设A′的坐标为(x′A,y′A),同理表示B’C’D’E’F’G’H’点的坐标;
设A″的坐标为(x″A,y″A),同理表示B”C”D”E”F”G”H”点的坐标;
补全后的图像A”B”C”D”与做线性变换后的目标图像A’B’C’D’的相互关系为:
x″A=x″B=min{x′A,x′B,x′C,x′D}
y″B=y″C=max{y′A,y′B,y′C,y′D}
x″C=x″D=max{x′A,x′B,x′C,x′D}
y″A=y″D=min{y′A,y′B,y′C,y′D}
x″E=x″F=min{x′E,x′F,x′G,x′H}
y″F=y″G=max{y′E,y′F,y′G,y′H}
x″G=x″H=max{x′E,x′F,x′G,x′H}
y″E=y″H=min{y′E,y′F,y′G,y′H}
在扩充图像的过程中多出的部分,全部进行填充白色(RGB(255,255,255))的处理;
矩形E”F”G”H”为扩充后的边界框,令扩充后的图像像素值为x0,new×y0,new,即
x0,new=max{x′A,x′B,x′C,x′D}-min{x′A,x′B,x′C,x′D}
y0,new=max{y′A,y′B,y′C,y′D}-min{y′A,y′B,y′C,y′D}
xnew=min{x′E,x′F,x′G,x′H}-min{x′A,x′B,x′C,x′D}
ynew=max{y′A,y′B,y′C,y′D}-max{y′E,y′F,y′G,y′H}
wnew=max{x′E,x′F,x′G,x′H}-min{x′E,x′F,x′G,x′H}
hnew=max{y′E,y′F,y′G,y′H}-min{y′E,y′F,y′G,y′H}
(xnew,ynew,wnew,hnew)为扩充后的边界框的位置参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川奇迹云科技有限公司;四川虹电数字家庭产业技术研究院有限公司,未经四川奇迹云科技有限公司;四川虹电数字家庭产业技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810734583.9/1.html,转载请声明来源钻瓜专利网。