[发明专利]图片表格用户交互增强识别的方法有效
| 申请号: | 201910914814.9 | 申请日: | 2019-09-25 |
| 公开(公告)号: | CN110826400B | 公开(公告)日: | 2022-08-23 |
| 发明(设计)人: | 杜海阳;姚远;柳遵梁 | 申请(专利权)人: | 杭州美创科技有限公司 |
| 主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V10/26 |
| 代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 阎忠华 |
| 地址: | 310011 浙江省杭州市拱*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图片 表格 用户 交互 增强 识别 方法 | ||
1.一种图片表格用户交互增强识别的方法,其特征是,包括如下步骤:
(1-1)在客户端应用中选择本地图片或者网络图片,作为识别对象图片,传递给识别服务器;
(1-2)图片表格直线识别
识别服务器对识别对象图片进行二值化,采用opencv中的霍夫寻线算法,找到识别对象图片中的所有横线和纵线;
(1-3)表格结构识别;
步骤(1-3)包括如下步骤:
识别服务器获得所有横线和纵线的交叉点,将所有交叉点的左边存入顶点集合中,如果任意两个交叉点A和B的距离5像素,则将A和B中的任一个删除;
如果任意一条横线C与所有纵线均没有交叉点,则将C删除;
如果任意一条纵线D与所有横线均没有交叉点,则将D删除;
如果任意横线E的长度<10像素,将横线E删除;
如果任意纵线F的长度<10像素,将横线F删除;
(1-4)识别服务器将识别好的所有横线、所有纵线和所有交叉点发送给客户端,将识别好的所有横线、所有纵线和所有交叉点按照其所在位置的坐标以图片形式呈现在界面上,用户对图片中的直线和交叉点进行增加和删除;
(1-5)用户校正完毕后,将校正后的横线、纵线和交叉点坐标提交到识别服务器,识别服务器接收到请求后,根据用户校正结果,将每个矩形区域切割成一张矩形图片;
将每个矩形区域切割成一张矩形图片包括如下步骤:
(5-1)对所有纵线按照y坐标值从小到大进行排序,对所有横线按照x坐标值从小到大进行排序;
(5-2)遍历顶点集合,找到任意矩形的左上角顶点和右下角顶点,连接左上角顶点和右下角顶点得到线段L,计算线段L和所有纵线和横线的交点的个数,如果交点的个数只有2个,则左上角顶点和右下角顶点形成的矩形是图片中的最小矩形,将最小矩形放入最小矩形集合中;反之,如果交点的个数大于2个,则左上角顶点和右下角顶点形成的矩形不是图片中的最小矩形;
(5-3)遍历最小矩形集合,根据最小矩形的4个顶点坐标对图片进行切割;
(1-6)识别服务器对每张矩形图片,进行文字识别,将每个矩形图片上的信息发给客户端。
2.根据权利要求1所述的图片表格用户交互增强识别的方法,其特征是,步骤(1-2)还包括如下步骤:
直线识别之前,利用opencv中的threshold函数计算图片的倾斜角度;如果倾斜角度大于0,利用getRotationMatrix2D方法提取待旋转矩阵,然后利用warpAffine函数进行图片旋转。
3.根据权利要求1所述的图片表格用户交互增强识别的方法,其特征是,采用opencv中的霍夫寻线算法,找到识别对象图片中的所有横线和纵线包括如下步骤:
利用opencv中的cvtColror将识别对象图片转为灰度图像,建立纵向滤波器和横向滤波器;
如果识别对象图片的宽度和高度比>20,则对识别对象图片进行拉伸,使识别对象图片的宽度和高度比为1至5;
利用HoughLinesP函数进行横线和纵线的查找,得到的横线两端的坐标存到横线集合中,得到的纵线两端的坐标存到纵线集合中;
如果没有查找到任何横线或任何纵线,或者只有横线或纵线,则做出识别对象图片为非带表格图片的判断,返回错误提示,结束本次识别过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州美创科技有限公司,未经杭州美创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910914814.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:复合石墨导热膜及其制备工艺
- 下一篇:一种船用静音门结构





