[发明专利]文本的识别方法和识别装置有效
申请号: | 202110323752.1 | 申请日: | 2021-03-26 |
公开(公告)号: | CN112712072B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 肖娅;郅韬;刘霄 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06N3/04 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 安伟 |
地址: | 100089 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 识别 方法 装置 | ||
本发明涉及一种文本的识别方法和识别装置。该识别方法包括:接收待识别文本图像,获取待识别文本图像对应的特征序列,其中,待识别文本图像包括:文字内容和标记符号;获取特征序列中每个特征对应的文字内容,建立特征组和文字内容的对应关系,其中,一个特征组包括至少一个特征,一个特征组内的特征对应同一个文字内容;根据特征组和文字内容的对应关系,获取特征组对应的标记符号;根据特征组和文字内容的对应关系,以及特征组对应的标记符号,获取文字内容和标记符号的对应关系;根据文字内容和标记符号的对应关系输出识别结果。该文本的识别方法能够解决普通文本与标记符号位置无法对齐的问题。
技术领域
本公开涉及图像识别技术领域,尤其涉及一种文本的识别方法和识别装置。
背景技术
光学字符识别(Optical Character Recognition,OCR)是通过电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。这种字符识别的方法由于其智能化,广泛应用于教育、金融、物流、安防等领域。二维标记文字包括普通文本和特殊标识,且特殊标识和普通文本构成一一对应的结果对,例如波浪线、下划线、着重号等特殊标识与普通文字区域组成含有标记符号的文本。
现有技术中,通过注意力(Attention)机制实现含有标记符号的文本的识别,但是Attention机制存在漂移问题,无法实现普通文本与标记符号的对齐。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明实施例提供了一种文本的识别方法和识别装置,能够解决普通文本与标记符号结果无法对齐的问题。
第一方面,本发明实施例提供了一种文本的识别方法,包括:
接收待识别文本图像,获取所述待识别文本图像对应的特征序列,其中,所述待识别文本图像包括:文字内容和标记符号;
获取所述特征序列中每个特征对应的文字内容,建立特征组和所述文字内容的对应关系,其中,一个所述特征组包括至少一个特征,一个所述特征组内的特征对应同一个文字内容;
根据所述特征组和所述文字内容的对应关系,获取所述特征组对应的标记符号;
根据所述特征组和所述文字内容的对应关系,以及所述特征组对应的标记符号,获取所述文字内容和所述标记符号的对应关系;
根据所述文字内容和所述标记符号的对应关系输出识别结果。
可选地,所述获取所述待识别文本图像对应的特征序列,包括:
对所述待识别文本图像进行多次卷积和多次池化,获取所述待识别文本图像对应的特征序列。
可选地,所述对所述待识别文本图像进行多次卷积和多次池化,获取所述待识别文本图像对应的特征序列,包括:
对所述待识别文本图像进行一次卷积和一次池化,获取第一结果;
对所述第一结果进行两次卷积和一次池化,获取第二结果;
对所述第二结果进行四次卷积和一次池化,获取第三结果;
对所述第三结果进行两次卷积和一次池化,获取第四结果;
对所述第四结果进行一次卷积,获取所述待识别文本图像对应的特征序列。
可选地,所述获取所述特征序列中每个特征对应的文字内容,包括:
根据所述特征序列,获取所述特征序列中每个特征对应的文字概率矩阵;
根据所述文字概率矩阵中最大概率值对应的文字内容,获取所述每个特征对应的文字内容。
可选地,所述获取所述特征序列中每个特征对应的文字概率矩阵,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110323752.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种判题方法、装置、电子设备及存储介质
- 下一篇:烟炱分散剂