[发明专利]文本识别模型的训练方法、文本识别方法及装置有效
申请号: | 202210685043.2 | 申请日: | 2022-03-22 |
公开(公告)号: | CN115035538B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 章成全;庾悦晨;李煜林;曹健健;钦夏孟;姚锟;韩钧宇;刘经拓;丁二锐;王井东 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/18;G06V30/16;G06V10/82;G06N3/0464;G06N3/08;G06F40/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 马姣琴;臧建明 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种文本识别模型的训练方法、文本识别方法及装置,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于光学字符识别等场景。方案为:对获取到的第一样本图像中的部分图像进行掩码预测,得到与第一样本图像对应的预测完整图像,对获取到的第二样本图像中的部分文本进行掩码预测,得到与部分文本对应的预测文本内容,根据预测完整图像和预测文本内容训练得到预训练模型,并根据预训练模型生成文本识别模型,文本识别模型用于对待识别图像进行文本识别,使得预训练模型学习到较强的图像视觉推理能力和文本语义推理能力,从而当基于预训练模型生成的文本识别模型进行文本识别时,提高文本识别的准确性和可靠性。 | ||
搜索关键词: | 文本 识别 模型 训练 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210685043.2/,转载请声明来源钻瓜专利网。