[发明专利]一种文字数据的检测方法、装置及电子设备在审
申请号: | 201911155385.8 | 申请日: | 2019-11-22 |
公开(公告)号: | CN112836696A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 徐露露;马龙;许静芳 | 申请(专利权)人: | 搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 马苗苗 |
地址: | 310016 浙江省杭州市杭州经济*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 数据 检测 方法 装置 电子设备 | ||
1.一种文字数据的检测方法,其特征在于,包括:
将待检测图像输入预先训练好的全卷积网络,获得像素分类特征图、文本行高度特征图及文本行宽度特征图;
根据所述像素分类特征图获取所述待检测图像中文本行的连通域;
通过所述文本行高度特征图中的高度和所述文本行宽度特征图中的宽度对所述连通域对应的文字行进行监督,获得所述连通域的高度基准和/或宽度基准;
根据所述连通域以及所述高度基准和/或所述宽度基准,获得所述待检测图像中的文字行。
2.如权要要求1所述的方法,其特征在于,所述通过所述文本行高度特征图中的高度和所述文本行宽度特征图中的宽度对所述连通域对应的文字行进行监督,获得所述连通域的高度基准和/或宽度基准,包括:
获得所述连通域在所述像素特征图中所处的位置区域;
获得所述文本行高度特征图中所述位置区域内的高度数据并计算其平均高度,以及,获得所述文本行宽度特征图中所述位置区域内的宽度数据并计算其平均宽度;
根据第一预设比例对所述平均高度进行转换获得所述平均高度对应的参考宽度,获得所述参考宽度和所述平均宽度中的较小值作为所述宽度基准;和/或,
根据第二预设比例对所述平均宽度进行转换获得所述平均宽度对应的参考高度,获得所述参考高度和所述平均高度中的较小值作为所述高度基准。
3.如权利要求2所述的方法,其特征在于,所述根据所述连通域以及所述高度基准和/或所述宽度基准,获得所述待检测图像中的文字行,包括:
根据所述高度基准和/或所述宽度基准,对所述连通域的最小面积外接矩形执行等比例放大操作;
根据所述放大操作后的外接矩形所在位置,获得所述待检测图像中相同位置处的图像内容作为所述文字行。
4.如权利要求1所述的方法,其特征在于,所述全卷积网络的检测单元包括:深度残差网络单元、通道注意力模块和空间注意力模块。
5.如权利要求1所述的方法,其特征在于,所述全卷积网络的训练方法包括:
获得N个样本图像,N为大于1的整数;
对每个所述样本图像中文字行所在区域进行坐标点标记获得标记后的第一图像;
对每个所述样本图像中文字行的高度进行坐标点标记获得标记后的第二图像;
对每个所述样本图像中文字行的宽度进行坐标点标记获得标记后的第三图像;
将每个所述样本图像作为模型输入、将每个所述样本图像对应的所述第一图像、所述第二图像及所述第三图像作为每个所述样本图像的训练结果标记对所述全卷积网络进行模型训练,获得训练后的所述全卷积网络。
6.一种文字数据的检测装置,其特征在于,包括:
第一获取单元,用于将待检测图像输入预先训练好的全卷积网络,获得像素分类特征图、文本行高度特征图及文本行宽度特征图;
第二获取单元,用于根据所述像素分类特征图获取所述待检测图像中文本行的连通域;
监督单元,用于通过所述文本行高度特征图中的高度和所述文本行宽度特征图中的宽度对所述连通域对应的文字行进行监督,获得所述连通域的高度基准和/或宽度基准;
第三获取单元,用于根据所述连通域以及所述高度基准和/或所述宽度基准,获得所述待检测图像中的文字行。
7.如权要要求6所述的装置,其特征在于,所述监督单元用于:
获得所述连通域在所述像素特征图中所处的位置区域;
获得所述文本行高度特征图中所述位置区域内的高度数据并计算其平均高度,以及,获得所述文本行宽度特征图中所述位置区域内的宽度数据并计算其平均宽度;
根据第一预设比例对所述平均高度进行转换获得所述平均高度对应的参考宽度,获得所述参考宽度和所述平均宽度中的较小值作为所述宽度基准;和/或,
根据第二预设比例对所述平均宽度进行转换获得所述平均宽度对应的参考高度,获得所述参考高度和所述平均高度中的较小值作为所述高度基准。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司,未经搜狗(杭州)智能科技有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911155385.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置