首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]文本识别方法、装置、设备和计算机可读介质在审

申请号：	201910204450.5	申请日：	2019-03-18
公开（公告）号：	CN109934181A	公开（公告）日：	2019-06-25
发明（设计）人：	安耀祖	申请（专利权）人：	北京海益同展信息科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32
代理公司：	中原信达知识产权代理有限责任公司 11219	代理人：	张一军;张效荣
地址：	100176 北京市北京经济技***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	先验文本识别文本框计算机可读介质结构化文本文本检测特征图图像计算机技术领域检测器模型模型识别合并单阶段准确率文本
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文本识别方法，其特征在于，包括：

在具有结构化文本的图像中，定位所述图像中的表格；

使用文本检测模型识别所述表格内的一个或多个候选文本框，其中，所述文本检测模型是基于单阶段多框检测器模型，采用一个或多个特征图以及与所述特征图对应的先验框而得到的模型，所述先验框是由先验框比例(scale)和先验框长宽比来定义的；

合并所述一个或多个候选文本框，

以识别合并后的文本框中的文本。

2.根据权利要求1所述文本识别方法，其特征在于，所述使用文本检测模型识别所述表格内的一个或多个候选文本框之前，还包括：

根据训练图像的长度、所述训练图像的宽度、所述先验框长宽比和所述先验框比例，计算所述先验框的长度和宽度；

将所述训练图像输入单阶段多框检测器模型，利用所述先验框和所述训练图像中的文本的最小外接框进行匹配，训练得到所述文本检测模型。

3.根据权利要求1或2所述文本识别方法，其特征在于，所述文本检测模型的基础网络为卷积神经网络VGG16中的前A层卷积层，A是大于等于4且小于等于15的整数。

4.根据权利要求1所述文本识别方法，其特征在于，所述先验框长宽比包括3、5、7、10和15中的一个或多个。

5.根据权利要求1所述文本识别方法，其特征在于，所述在具有结构化文本的图像中，定位所述图像中的表格，包括：

利用边缘检测算法确定二值化处理后的图像的边缘；

基于所述图像的边缘，通过霍夫变换过滤得到所述图像中的表格。

6.一种文本识别装置，其特征在于，包括：

表格识别模块，用于在具有结构化文本的图像中，定位所述图像中的表格；

文本框检测模块，用于使用文本检测模型识别所述表格内的一个或多个候选文本框，其中，所述文本检测模型是基于单阶段多框检测器模型，采用一个或多个特征图以及与所述特征图对应的先验框而得到的模型，所述先验框是由先验框比例(scale)和先验框长宽比来定义的；

文本框确定模块，用于合并所述一个或多个候选文本框，以识别合并后的文本框中的文本。

7.根据权利要求6所述文本识别装置，其特征在于，所述装置还包括模型训练模块：

所述模型训练模块根据训练图像的长度、所述训练图像的宽度、所述先验框长宽比和所述先验框比例，计算所述先验框的长度和宽度；

将所述训练图像输入单阶段多框检测器模型，利用所述先验框和所述训练图像中的文本的最小外接框进行匹配，训练得到所述文本检测模型。

8.根据权利要求6所述文本识别装置，其特征在于，所述文本检测模型的基础网络为卷积神经网络VGG16中的前A层卷积层，A是大于等于4且小于等于15的整数。

9.根据权利要求6所述文本识别装置，其特征在于，所述先验框长宽比包括3、5、7、10和15中的一个或多个。

10.根据权利要求6所述文本识别装置，其特征在于，还包括：

所述表格识别模块利用边缘检测算法确定二值化处理后的图像的边缘；

所述表格识别模块基于所述图像的边缘，通过霍夫变换过滤得到所述图像中的表格。

11.一种用于文本识别的电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。

12.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京海益同展信息科技有限公司，未经北京海益同展信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910204450.5/1.html，转载请声明来源钻瓜专利网。

上一篇：指纹识别方法及相关装置
下一篇：对象行为分析方法、装置、电子设备及计算机存储介质

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top