[发明专利]文本图像区域检测方法、相关设备及可读存储介质在审
| 申请号: | 202111616149.9 | 申请日: | 2021-12-27 |
| 公开(公告)号: | CN114283419A | 公开(公告)日: | 2022-04-05 |
| 发明(设计)人: | 张晋;张银田 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06T7/62;G06T7/11;G06V10/26;G06V10/774 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 宋东阳 |
| 地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 图像 区域 检测 方法 相关 设备 可读 存储 介质 | ||
1.一种文本图像区域检测方法,其特征在于,所述方法包括:
获取待进行区域检测的文本图像;
对所述文本图像中的第一目标进行实例分割处理,得到所述第一目标的区域检测结果;
对所述文本图像中的第二目标进行语义分割处理,得到所述第二目标的区域检测结果;
基于所述第一目标的区域检测结果以及所述第二目标的区域检测结果,确定所述文本图像的区域检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述文本图像中的第一目标进行实例分割处理,得到所述第一目标的区域检测结果,包括:
将所述文本图像输入训练好的实例分割模型,所述实例分割模型输出所述第一目标的区域检测结果,所述实例分割模型是以训练用文本图像为训练样本,以训练用文本图像标注的所述第一目标包含的真实区域框及每个真实区域框的类型为样本标签,训练得到的。
3.根据权利要求2所述的方法,其特征在于,所述实例分割模型包括特征图提取模块、区域框生成模块,区域框筛选模块和区域框检测模块;
所述实例分割模型的训练过程包括:
所述特征图提取模块对所述训练用文本图像进行特征图提取,得到所述训练用文本图像的特征图;
所述区域框生成模块基于所述训练用文本图像的特征图确定所述训练用文本图像中的第一目标包含的多个区域框;
所述区域框筛选模块,针对所述区域框生成模块生成的每个区域框,基于所述区域框的形状信息,确定所述区域框对应的非极大值抑制阈值;并基于各个区域框对应的非极大值抑制阈值,从所述区域框生成模块生成的多个区域框中筛选出待检测的区域框,并将所述待检测的区域框输入所述区域框检测模块。
4.根据权利要求3所述的方法,其特征在于,所述基于所述区域框的形状信息,确定所述区域框对应的非极大值抑制阈值,包括:
计算所述区域框的最小外接矩形框的倾斜角和宽高比;
获取预设的基准非极大值抑制阈值,倾斜角阈值、宽高比阈值;
当所述区域框的最小外接矩形框的倾斜角大于所述倾斜角阈值,且所述区域框的最小外接矩形框的宽高比大于所述宽高比阈值,则对所述基准非极大值抑制阈值进行调整,将调整后的非极大值抑制阈值,确定为所述区域框对应的非极大值抑制阈值;所述调整后的非极大值抑制阈值大于所述基准非极大值抑制阈值;
否则,将所述基准非极大值抑制阈值确定为所述区域框对应的非极大值抑制阈值。
5.根据权利要求3所述的方法,其特征在于,所述基于各个区域框对应的非极大值抑制阈值,从所述区域框生成模块生成的多个区域框中筛选出待检测的区域框,包括:
针对所述区域框生成模块生成的每个区域框,计算所述区域框与当前置信度得分最高的区域框的交并比;
当所述区域框与当前置信度得分最高的区域框的交并比大于所述区域框对应的非极大值抑制阈值,则将所述区域框丢弃;否则,将所述区域框确定为待检测区域框。
6.根据权利要求3所述的方法,其特征在于,所述区域框检测模块包括级联的三个检测子模块,前一检测子模块的输出作为后一检测子模块的输入;最后一个检测子模块的输出作为所述实例分割模型的输出;每个检测子模块设置有基准交并比阈值;
所述实例分割模型的训练过程还包括:
针对每个检测子模块,对于输入所述检测子模块的区域框,所述检测子模块基于所述基准交并比阈值以及所述区域框的面积确定所述区域框对应的交并比阈值,并基于所述区域框对应的交并比阈值为所述区域框分配标签。
7.根据权利要求6所述的方法,其特征在于,所述基于所述基准交并比阈值以及所述区域框的面积确定所述区域框对应的交并比阈值,包括:
如果所述区域框的面积小于所述面积阈值,则调整所述基准交并比阈值,得到调整后的交并比阈值作为所述区域框对应的交并比阈值,所述调整后的交并比阈值小于所述基准交并比阈值;
如果所述区域框的面积大于等于所述面积阈值,则将所述基准交并比阈值作为所述区域框对应的交并比阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111616149.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低温去除多孔炭中微量氧的方法
- 下一篇:医学检验实验室使用的可调移液器
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





