[发明专利]一种文本识别方法、装置、设备及存储介质在审

申请号：	202111137451.6	申请日：	2021-09-27
公开（公告）号：	CN113887375A	公开（公告）日：	2022-01-04
发明（设计）人：	刘秩铭;邵明	申请（专利权）人：	浙江大华技术股份有限公司
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	张洁
地址：	310053 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文本识别方法，其特征在于，所述方法包括：

根据已训练的文本检测模型，确定待识别图像的多个目标文本区域；

根据已训练的第一文本识别模型，对所述多个目标文本区域进行文本识别，获取所述多个目标文本区域各自对应的第一文本识别结果；其中，所述第一文本识别模型根据文本语义信息确定所述第一文本识别结果；

根据已训练的第二文本识别模型，对所述多个目标文本区域进行文本识别，获取所述多个目标文本区域各自对应的第二文本识别结果；其中，所述第二文本识别模型根据文本长度和文本语义信息确定所述第二文本识别结果；

根据多个第一文本识别结果和多个第二文本识别结果各自包含的第一置信度，确定所述待识别图像对应的多个目标文本识别结果；其中，所述第一置信度用于指示文本识别结果所对应的目标文本区域中存在特定字符的概率；一个目标文本区域对应多个识别结果，且所述多个识别结果中置信度最大的识别结果，为所述一个目标文本区域的目标文本识别结果。

2.如权利要求1所述的方法，其特征在于，所述根据已训练的文本检测模型，确定待识别图像的多个目标文本区域，包括：

根据所述已训练的文本检测模型，确定所述待识别图像中的各个像素点为单个字符的中心点的第一概率，以及所述各个像素点为任意相邻两个字符之间的中心点的第二概率；

根据所述第一概率，得到多个局部图像区域；

针对每一个局部图像区域，根据所述第二概率，对所述每一个局部图像区域进行分割，确定所述每一个局部图像区域对应的多个候选文本区域；

根据所述多个局部图像区域各自对应的多个候选文本区域，确定待识别图像的多个目标文本区域。

3.如权利要求2所述的方法，其特征在于，所述根据所述多个候选文本区域，确定待识别图像的多个目标文本区域，包括：

确定所述多个候选文本区域各自对应的第二置信度；其中，所述第二置信度用于指示所述候选文本区域中存在本文的概率；

针对所述多个候选文本区域中的一个候选文本区域，确定所述一个候选文本区域对应的第二置信度是否大于设定的第二置信度阈值；

在确定大于设定的第二置信度阈值时，将所述一个候选文本区域确定为目标文本区域。

4.如权利要求3所述的方法，其特征在于，所述在确定大于设定的第二置信度阈值时，将所述一个候选文本区域确定为目标文本区域，包括：

在确定大于设定的第二置信度阈值时，将所述一个候选文本区域进行二值化处理，获得第一候选文本区域；

对所述第一候选文本区域进行连通域分析，确定所述第一候选文本区域是否为连通区域；其中，所述连通区域为具有相同像素值且位置相邻的非背景像素点组成的图像区域；