[发明专利]表格图像及对应标注信息的生成方法、装置及存储介质在审
| 申请号: | 202210203324.X | 申请日: | 2022-03-03 |
| 公开(公告)号: | CN114581923A | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 孙杰;丁拥科 | 申请(专利权)人: | 众安在线财产保险股份有限公司 |
| 主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/413;G06V10/774 |
| 代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 谢浩荣 |
| 地址: | 200002 上海市黄*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 表格 图像 对应 标注 信息 生成 方法 装置 存储 介质 | ||
1.一种表格图像及对应标注信息生成方法,其特征在于,所述方法包括:
根据场景信息,收集所述场景信息对应的语料形成语料库;
对表格参数进行定义,并记录在配置文件中;
结合所述配置文件和所述语料库,渲染生成表格样本图片和标注图片;
提取所述标注图片,生成标注信息。
2.根据权利要求1所述的方法,其特征在于,在生成标注图片之前,还包括:在所述配置文件中的添加修改文字底色代码,以实现根据所述配置文件提取标注信息。
3.根据权利要求2所述的方法,其特征在于,还包括:批量生成所述表格样本图片和所述标注信息,形成数据集,利用所述数据集对神经网络模型进行训练和/或验证。
4.根据权利要求1所述的方法,其特征在于,对表格参数进行定义,具体包括:
根据所述场景信息对表格结构和/或表格内容和/或表格样式进行定义。
5.根据权利要求4所述的方法,其特征在于,提取所述标注图片,生成标注信息,具体包括:
提取所述标注图片,得到文字坐标和框线坐标;
结合所述配置文件、所述文字坐标和所述框线坐标,得到所述标注信息。
6.根据权利要求5所述的方法,其特征在于,分离所述标注图片,得到文字标注图和表格标注图;
基于所述文字标注图提取轮廓坐标,生成文字坐标;
基于所述表格标注图,进行轮廓检测,得到框线坐标。
7.根据权利要求6所述的方法,其特征在于,对所述表格标注图进行二值化,得到表格二值化图;
对所述表格二值化图进行腐蚀和膨胀,分离所述表格二值化图中的横线,得到横线图;
对所述表格二值化图进行腐蚀和膨胀,分离所述表格二值化图中的竖线,得到纵线图;
根据所述横线图和所述纵线图,提取得框线坐标。
8.一种基于表格图像及对应标注信息的生成方法的装置,其特征在于,所述装置包括:
语料配置模块,用于根据场景信息,收集所述场景信息对应的语料形成语料库;
文件配置模块,用于对表格参数进行定义,并记录在配置文件中;
渲染模块,用于集合所述配置文件和所述语料库,渲染生成表格样本图片和标注图片;
提取模块,提取所述标注图片,生成标注信息。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安在线财产保险股份有限公司,未经众安在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210203324.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





