[发明专利]一种面向目标检测的甲骨文拓片数据增强方法在审

专利信息
申请号: 202210431581.9 申请日: 2022-04-22
公开(公告)号: CN114897716A 公开(公告)日: 2022-08-12
发明(设计)人: 方昱春;万修安;潘守永 申请(专利权)人: 上海大学
主分类号: G06T5/00 分类号: G06T5/00
代理公司: 北京汇信合知识产权代理有限公司 11335 代理人: 王维新
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 目标 检测 甲骨文 拓片 数据 增强 方法
【说明书】:

发明提供一种面向目标检测的甲骨文拓片数据增强方法,涉及数字图像处理及计算机视觉技术领域,包括:将多个含噪声的真实甲骨文拓片单字图像进行网格化随机摆放,记录对应的包围盒;根据包围盒计算包围凸多边形,并进行多级向心三角网格化,得到多级边缘和三角网格重心坐标集;利用随机椭圆在多级边缘和三角网格重心坐标给出的随机贝塞尔曲线上侵蚀,生成不含噪声的模拟拓片底;根据各真实甲骨文拓片单字图像的摆放位置与模拟拓片底得到素材图和语义图;将素材图和语义图输入含噪声虚拟拓片图像生成模型,得到含噪声的甲骨文目标检测拓片。本发明为含噪声甲骨文目标检测模型所需的拓片数据提供了增强方法,生成的增强拓片数据多样与自然。

技术领域

本发明涉及数字图像处理及计算机视觉技术领域,涉及一种面向目标检测的甲骨文拓片数据增强方法。

背景技术

甲骨文拓片目标检测是甲骨文计算分析方法论中的基础方法之一,其根本目的是为甲骨缀合、甲骨文识别等计算方法提供拓片图像上甲骨文单字的确切位置或是为甲骨文拓片的人工标注提供辅助指导,对于甲骨学研究有着重要的意义。由于甲骨文拓片普遍存在灼烧、断裂、钻凿、磨损、侵蚀等原因造成的各类噪声使得传统的文字检测方法在甲骨文拓片数据上难以取得满意的结果。

近年来,基于深度学习的目标检测模型在甲骨文检测中取得了一些较好的结果,然而由于目标检测模型需要大量的标注数据进行训练,而对甲骨文拓片进行目标检测任务标注不仅需要标注人员对甲骨学具有丰富的知识以正确标注合体字、异体字等复杂字体的包围盒并将甲骨字与划痕等噪声区别开来,而且费时费力,能用于目标检测的拓片数据往往需要如高分辨率扫描等充分的前置数据准备工作,故,目前除安阳师范学院殷契文渊网站公开的含9134幅有标注甲骨文拓片目标检测数据集外并没有丰富的公开甲骨文拓片目标检测数据集;然而目前已存在如含309551张甲骨字符图像的OBC306等较大规模的公开甲骨文单字数据集。

另外,使用数字图像处理方法对甲骨文拓片进行去噪后再进行检测不失为一种可行的方法,但由于甲骨字与拓片上所含噪声确实具有一定程度的相似性,故直接对含噪声的拓片进行检测理论上会损失更少的有效信息。

因此,基于目前甲骨拓片目标检测及标注的困难性、甲骨拓片目标检测数据集与单字数据集的数量差异,目前尚缺少一种面向目标检测的甲骨文拓片数据增强方法,实现含噪声甲骨文目标检测拓片的数据增强。

发明内容

针对上述问题,本发明提供了一种面向目标检测的甲骨文拓片数据增强方法,利用丰富的含噪声甲骨文单字数据进行含噪声的虚拟甲骨文拓片目标检测数据构建,从而解决甲骨文拓片目标检测数据匮乏的问题。

为实现上述目的,本发明提供了一种面向目标检测的甲骨文拓片数据增强方法,包括:

将多个含噪声的真实甲骨文拓片单字图像进行网格化随机摆放,记录各所述真实甲骨文拓片单字图像摆放位置对应的包围盒;

根据随机摆放结果及所述包围盒计算包围凸多边形,对所述包围凸多边形进行多级向心三角网格化,得到多级边缘和三角网格重心坐标集;

利用随机椭圆在所述多级边缘和三角网格重心坐标给出的随机贝塞尔曲线上侵蚀,并通过图形学操作生成不含噪声的模拟拓片底;

根据各所述真实甲骨文拓片单字图像的摆放位置与所述模拟拓片底得到素材图和语义图;

将所述素材图和所述语义图输入含噪声虚拟拓片图像生成模型,得到含噪声的甲骨文目标检测拓片。

作为本发明的进一步改进,所述将多个含噪声的真实甲骨文拓片单字图像进行网格化随机摆放,记录各所述真实甲骨文拓片单字图像摆放位置对应的包围盒;包括:

根据真实甲骨文图像数据集构建真实甲骨文备选单字图像数据集;

根据摆放所述真实甲骨文单字图像的画布,分割并构建网格集合;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210431581.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top