[发明专利]文字检测和模型训练方法、装置、设备及存储介质在审
| 申请号: | 202210404529.4 | 申请日: | 2022-04-18 |
| 公开(公告)号: | CN114724133A | 公开(公告)日: | 2022-07-08 |
| 发明(设计)人: | 黄聚;张晓强;钦夏孟;章成全;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/146;G06V30/148;G06V30/19;G06V30/414;G06V10/82;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨丽爽;臧建明 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 检测 模型 训练 方法 装置 设备 存储 介质 | ||
本公开提供了一种文字检测和模型训练方法、装置、设备及存储介质,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别等场景。具体实现方案为:获取训练样本,训练样本中包括样本图像和标签图像,标签图像为对所述样本图像上的文本实例进行标注得到的图像;将样本图像输入至文字检测模型,得到文字检测模型输出的分割图像和分割图像的图像类别,其中,图像类别指示分割图像中包括文本实例,或者,不包括文本实例;根据分割图像、分割图像的图像类别和标注图像对文字检测模型的参数进行调整。对图像中的文字以文本实例为单元进行检测得到检测结果,文字检测的准确性较高。
技术领域
本公开涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域,可应用于光学字符识别(Optical Character Recognition,OCR)等场景,尤其涉及一种文字检测和模型训练方法、装置、设备及存储介质。
背景技术
文字检测是指在包含有文字的图片中检测文本区域的过程,具体来说,文字检测的任务是输出图像中的每个目标文本的边界框,而并不关心目标文本的具体语义内容。
文字检测是文字识别、产品搜索等应用中的重要一环,文字检测的准确程度会影响后续文字识别的效果。因此,需要提供一种准确性较高的文字检测方案,提升文字检测能力,有效增强身份证识别、文档识别、票据识别等业务的准确率和鲁棒性。
发明内容
本公开提供了一种文字检测和模型训练方法、装置、设备及存储介质。
根据本公开的第一方面,提供了一种文字检测方法,包括:
获取待检测的第一图像;
将所述第一图像输入至文字检测模型,得到所述文字检测模型输出的分割图像和所述分割图像的图像类别,其中,所述图像类别指示所述分割图像中包括文本实例,或者,不包括文本实例;
根据所述分割图像和所述图像类别,在所述第一图像上确定目标区域,所述目标区域中包括文本实例。
根据本公开的第二方面,提供了一种模型训练方法,包括:
获取训练样本,所述训练样本中包括样本图像和标签图像,所述标签图像为对所述样本图像上的文本实例进行标注得到的图像;
将所述样本图像输入至所述文字检测模型,得到所述文字检测模型输出的分割图像和所述分割图像的图像类别,其中,所述图像类别指示所述分割图像中包括文本实例,或者,不包括文本实例;
根据所述分割图像、所述分割图像的图像类别和所述标注图像对所述文字检测模型的参数进行调整。
根据本公开的第三方面,提供了一种文字检测装置,包括:
获取单元,用于获取待检测的第一图像;
处理单元,用于将所述第一图像输入至文字检测模型,得到所述文字检测模型输出的分割图像和所述分割图像的图像类别,其中,所述图像类别指示所述分割图像中包括文本实例,或者,不包括文本实例;
检测单元,用于根据所述分割图像和所述图像类别,在所述第一图像上确定目标区域,所述目标区域中包括文本实例。
根据本公开的第四方面,提供了一种模型训练装置,包括:
获取单元,用于获取训练样本,所述训练样本中包括样本图像和标签图像,所述标签图像为对所述样本图像上的文本实例进行标注得到的图像;
处理单元,用于将所述样本图像输入至所述文字检测模型,得到所述文字检测模型输出的分割图像和所述分割图像的图像类别,其中,所述图像类别指示所述分割图像中包括文本实例,或者,不包括文本实例;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210404529.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种猜图方法及系统
- 下一篇:表格识别方法及装置、存储介质及电子设备





