[发明专利]图像中的文本行检测方法、装置及计算机系统在审
| 申请号: | 201910227708.3 | 申请日: | 2019-03-25 |
| 公开(公告)号: | CN111738252A | 公开(公告)日: | 2020-10-02 |
| 发明(设计)人: | 杨志博;王永攀 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
| 代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 南海燕 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 中的 文本 检测 方法 装置 计算机系统 | ||
1.一种图像中的文本行检测方法,其特征在于,包括:
建立目标算法模型;
将待预测的目标图像输入到所述目标算法模型中,获得预测结果,所述预测结果包括所述目标图像中多个像素点的方向场信息,所述方向场信息包括:所述像素点属于文字的置信度信息,以及像素点相对于其可能所属的文本行的中心线的方向信息;
根据所述多个像素点的方向场信息进行文本行分割。
2.根据权利要求1所述的方法,其特征在于,
所述目标图像中包括按照曲线排列的文字组成的文本行,且不同文本行之间的行间距小于阈值。
3.根据权利要求1所述的方法,其特征在于,
所述建立目标算法模型,包括:
获得训练样本图像,以及对应的标注结果,所述标注结果包括:所述训练样本图像中包括的文本行的包围框,以及所述文本行内的像素点相对于文本行中心线的方向信息;
获得初始状态的算法模型;
将所述训练样本图像作为输入信息,输入到算法模型中进行多次迭代,其中,每次迭代过程中,通过将算法模型输出的像素点的方向场信息与所述标注结果信息进行比对获得差异值,并根据所述差异值对所述算法模型进行调整,直到算法收敛,获得目标算法模型。
4.根据权利要求3所述的方法,其特征在于,
所述标注结果中,像素点相对于文本行中心线的方向信息包括:像素点相对于文本行中心线的方向角度信息,所述方向角度信息为:从所述像素点到文本行中心线上与其距离最近的点的连线方向角度信息。
5.根据权利要求4所述的方法,其特征在于,
所述标注结果中,像素点相对于文本行中心线的方向角度信息包括:像素点相对于文本行中心线的方向角度类别信息,其中,同一方向类别中包括同一方向区间内的多个像素点;
所述目标算法模型输出的预测结果中包括:像素点相对于其可能所属的文本行的中心线的方向角度类别信息。
6.根据权利要求5所述的方法,其特征在于,
所述标注结果中还包括不同的方向类别对应的不同颜色信息;
所述目标算法模型输出的预测结果包括:根据像素点相对于其可能所属的文本行的中心线的方向类别对应的颜色信息,提供的可视化的预测结果。
7.根据权利要求1至6任一项所述的方法,其特征在于,
所述根据所述多个像素点的方向场信息进行文本行分割,包括:
根据所述多个像素点的方向场信息确定相对于各自可能所属的文本行中心线的方向信息发生突变的目标像素点所在的位置;
根据所述目标像素点所在的位置确定文本行的行边界线,并进行文本行分割。
8.根据权利要求1至6任一项所述的方法,其特征在于,
所述待预测的目标图像包括:商品对象信息服务系统中待发布信息中包含的图像,所述待发布信息中包含的图像包括商品对象图,或者店铺对象图,或者品牌标志图。
9.根据权利要求1至6任一项所述的方法,其特征在于,
所述待预测的目标图像包括:具有印章文字以及被印章文字遮挡的文字的图像。
10.一种图像中的文本行检测装置,其特征在于,包括:
模型建立单元,用于建立目标算法模型;
预测单元,用于将待预测的目标图像输入到所述目标算法模型中,获得预测结果,所述预测结果包括所述目标图像中多个像素点的方向场信息,所述方向场信息包括:所述像素点属于文字的置信度信息,以及像素点相对于其可能所属的文本行的中心线的方向信息;
文本行分割单元,用于根据所述多个像素点的方向场信息进行文本行分割。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910227708.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





