[发明专利]图像文本行检测方法及装置、存储介质和电子设备在审
| 申请号: | 201811435156.7 | 申请日: | 2018-11-28 |
| 公开(公告)号: | CN109583367A | 公开(公告)日: | 2019-04-05 |
| 发明(设计)人: | 林丽;陈益如;徐彬彬;王嘉磊;温翔;丛林 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 袁礼君;阚梓瑄 |
| 地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 检测 待检测图像 文本行 存储介质 电子设备 图像 置信 文本 计算机技术领域 后处理 检测结果 模型获取 准确检测 概率 中文 | ||
1.一种图像文本行检测方法,其特征在于,包括:
获取待检测图像;
利用已训练的识别模型获取所述待检测图像的文本概率置信图;
对所述文本概率置信图进行后处理以获取所述待检测图像的文本行检测结果。
2.根据权利要求1所述的图像文本行检测方法,其特征在于,所述方法还包括:
预先训练所述识别模型,包括:
获取训练图像集;
根据所述训练图像集对全卷积神经网络FCN模型进行训练以获取所述识别模型;其中,所述FCN模型具有特征金字塔网络FPN结构。
3.根据权利要求2所述的图像文本行检测方法,其特征在于,所述根据所述训练图像集对FCN模型进行训练包括:
利用所述FCN模型对所述训练图像集分别执行分类任务和回归任务,并分别利用分类损失函数和回归损失函数对所述FCN模型进行优化。
4.根据权利要求3所述的图像文本行检测方法,其特征在于,利用FCN模型对所述训练图像集执行分类任务,利用分类损失函数对FCN模型进行优化包括:
利用所述FCN模型对训练图像执行分类任务以获取对应的文本概率置信图;
利用分类损失函数计算所述概率置信图的误差损失,并根据所述误差损失优化所述FCN模型。
5.根据权利要求3所述的图像文本行检测方法,其特征在于,利用FCN模型对所述训练图像集执行回归任务,利用回归损失函数对FCN模型进行优化包括:
利用所述FCN模型对训练图像执行回归任务以获取对应的包括多个文本行检测框的文本框检测图像;
利用所述回归损失函数计算所述文本框检测图像的误差损失,并根据所述误差损失优化所述FCN模型。
6.根据权利要求3所述的图像文本行检测方法,其特征在于,所述训练所述识别模型包括多个训练周期,所述方法还包括:
配置各训练周期中所述分类损失函数的权重值依次下降;且,
配置各训练周期中所述回归损失函数的权重值依次提升。
7.根据权利要求3所述的图像文本行检测方法,其特征在于,所述分类损失函数为:
其中,所述xi为所述概率置信图上像素点的预测值,所述为对应像素点的GroundTruth的像素值。
8.一种图像文本行检测装置,其特征在于,包括:
图像获取模块,用于获取待检测图像;
概率置信图获取模块,用于已训练的识别模型获取所述待检测图像的文字概率置信图;
检测结果生成模块,用于根据所述文字概率置信图获取所述待检测图像的文本行检测结果。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任一项所述的图像文本行检测方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~7中任一项所述的图像文本行检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811435156.7/1.html,转载请声明来源钻瓜专利网。





