[发明专利]一种柱状图数据提取和转化方法在审
| 申请号: | 202010979562.0 | 申请日: | 2020-09-17 |
| 公开(公告)号: | CN112101237A | 公开(公告)日: | 2020-12-18 |
| 发明(设计)人: | 王辰 | 申请(专利权)人: | 新华智云科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 田金霞 |
| 地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 柱状图 数据 提取 转化 方法 | ||
1.一种柱状图数据提取和转化方法,其特征在于,所述方法包括如下步骤:
获取柱状图;
采用目标检测模型识别柱状图中的文字、图例位置;
将识别的文字和图例进行分类,并采用文字识别模型识别文字,获取文字含义;
采用图像转文字模型识别柱状图中每一柱体的高度,并获取每一柱体的高度数据;
将分类后的文字、图例以及高度数据转化为结构数据。
2.根据权利要求1所述的一种柱状图数据提取和转化方法,其特征在于,将所述目标检测模型识别的文字和图例分类形成横坐标、纵坐标、标题、图例解释,用文字识别模型识别柱状图中的文字信息。
3.根据权利要求2所述的一种柱状图数据提取和转化方法,其特征在于,将识别的文字和图例进行分类包括如下步骤:识别图例的个数,并识别图例中的图例文字和图例元素,将每个图例元素和对应的图例文字相匹配并存储。
4.根据权利要求2所述的一种柱状图数据提取和转化方法,其特征在于,获取柱状图中所有图例的图例元素,采用图像转文字识别每一图例元素在柱状图中的位置,以及识别每一图例对应的横坐标信息,将图例元素和所述柱状图依次输入所述图像转文字模型,获取每一柱体的高度信息。
5.根据权利要求1所述的一种柱状图数据提取和转化方法,其特征在于,采用文字识别模型识别柱状图中的文字含义,根据识别的文字和纵坐标中点的高度信息获取纵坐标的尺度信息,所述尺度信息包括单位高度对应的数值、纵坐标总高度和总数值。
6.根据权利要求4所述的一种柱状图数据提取和转化方法,其特征在于,构建第二坐标系,所述第二坐标系包括第二横坐标和第二纵坐标,根据所述尺度信息和每一柱体的高度信息构建第二纵坐标,并对所述第二纵坐标分配对应的文字。
7.根据权利要求6所述的一种柱状图数据提取和转化方法,其特征在于,根据图例元素个数构建第二横坐标,将被识别的横坐标中的每个图例元素分配给所述第二横坐标,并根据识别的图例元素对所述第二横坐标分配文字或数值。
8.根据权利要求7所述的一种柱状图数据提取和转化方法,其特征在于,根据柱状图中的柱体高度信息和图例元素个数配置第二坐标系对应的图形,用于输出结构化数据。
9.根据权利要求1所述的一种柱状图数据提取和转化方法,其特征在于,所述目标检测模型可采用包括CascadeRCNN模型,SSD模型,yolo模型中的任意一种。
10.根据权利要求1所述的一种柱状图数据提取和转化方法,其特征在于,所述图像转文字模型包括encoding+decoding模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010979562.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





