[发明专利]一种文字数据的检测方法、装置及电子设备在审
申请号: | 201911155385.8 | 申请日: | 2019-11-22 |
公开(公告)号: | CN112836696A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 徐露露;马龙;许静芳 | 申请(专利权)人: | 搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 马苗苗 |
地址: | 310016 浙江省杭州市杭州经济*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 数据 检测 方法 装置 电子设备 | ||
本发明公开了一种文字数据的检测方法、装置及电子设备,该方法包括:将待检测图像输入预先训练好的全卷积网络获得像素分类特征图、文本行高度特征图及文本行宽度特征图;根据像素分类特征图获取待检测图像中文本行的连通域;通过文本行高度特征图中的高度和文本行宽度特征图中的宽度对连通域对应的文字行进行监督,获得连通域的高度基准和/或宽度基准;根据连通域以及高度基准或者宽度基准,获得待检测图像中的文字行。在上述方法中,通过全卷积网络获得图形的像素分类特征图、文本行高度特征图及文本行宽度特征图,并采用文本行高度特征图和文本行宽度特征图作为监督信息检测获得图像中的文字行,实现了文字行的自动检测,提高了文字行检测的效率。
技术领域
本发明涉及图像处理技术领域,特别涉及一种文字数据的检测方法、装置及电子设备。
背景技术
随着图像处理技术的不断发展,图像检测的对象越来越广泛,不仅可以检测出图像中的人物、动物、背景等,还可以检测出图像中的文字行,以便于进行文字提取、编辑等操作,给用户带来了诸多便利。
现如今,对图像中的文字行进行检测时,通常采用基于候选框区域来检测文字行,即需要用户通过候选框对需要进行文字行检测的区域进行选中,然后,对选中的区域进行文字行检测。由于该识别过程需要借助用户对检测区域进行定位,存在检测效率低下的技术问题。
发明内容
本发明实施例提供一种文字数据的检测方法、装置及电子设备,用于解决现有技术中文字行检测效率低下的技术问题,提高文字行的检测效率。
本发明实施例提供一种文字数据的检测方法,包括:
将待检测图像输入预先训练好的全卷积网络,获得像素分类特征图、文本行高度特征图及文本行宽度特征图;
根据所述像素分类特征图获取所述待检测图像中文本行的连通域;
通过所述文本行高度特征图中的高度和所述文本行宽度特征图中的宽度对所述连通域对应的文字行进行监督,获得所述连通域的高度基准和/或宽度基准;
根据所述连通域以及所述高度基准和/或所述宽度基准,获得所述待检测图像中的文字行。
可选的,所述通过所述文本行高度特征图中的高度和所述文本行宽度特征图中的宽度对所述连通域对应的文字行进行监督,获得所述连通域的高度基准和/或宽度基准,包括:
获得所述连通域在所述像素特征图中所处的位置区域;
获得所述文本行高度特征图中所述位置区域内的高度数据并计算其平均高度,以及,获得所述文本行宽度特征图中所述位置区域内的宽度数据并计算其平均宽度;
根据第一预设比例对所述平均高度进行转换获得所述平均高度对应的参考宽度,获得所述参考宽度和所述平均宽度中的较小值作为所述宽度基准;和/或,
根据第二预设比例对所述平均宽度进行转换获得所述平均宽度对应的参考高度,获得所述参考高度和所述平均高度中的较小值作为所述高度基准。
可选的,所述根据所述连通域以及所述高度基准或者所述宽度基准,获得所述待检测图像中的文字行,包括:
根据所述高度基准或者所述宽度基准,对所述连通域的最小面积外接矩形执行等比例放大操作;
根据所述放大操作后的外接矩形所在位置,获得所述待检测图像中相同位置处的图像内容作为所述文字行。
可选的,所述全卷积网络的检测单元包括:深度残差网络单元、通道注意力模块和空间注意力模块。
可选的,所述全卷积网络的训练方法包括:
获得N个样本图像,N为大于1的整数;
对每个所述样本图像中文字行所在区域进行坐标点标记获得标记后的第一图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司,未经搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911155385.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置