[发明专利]文本的识别方法和识别装置有效
| 申请号: | 202110323752.1 | 申请日: | 2021-03-26 |
| 公开(公告)号: | CN112712072B | 公开(公告)日: | 2021-07-23 |
| 发明(设计)人: | 肖娅;郅韬;刘霄 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06N3/04 |
| 代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 安伟 |
| 地址: | 100089 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 识别 方法 装置 | ||
1.一种文本的识别方法,其特征在于,包括:
接收待识别文本图像,获取所述待识别文本图像对应的特征序列,其中,所述待识别文本图像包括:文字内容和标记符号;
获取所述特征序列中每个特征对应的文字内容,建立特征组和所述文字内容的对应关系,其中,一个所述特征组包括至少一个特征,一个所述特征组内的特征对应同一个文字内容;
根据所述特征组和所述文字内容的对应关系和所述特征序列中每个特征对应的标记符号,获取所述特征组对应的标记符号,其中,一个特征组内的特征对应同一个标记符号;
根据所述特征组和所述文字内容的对应关系,以及所述特征组对应的标记符号,获取所述文字内容和所述标记符号的对应关系;
根据所述文字内容和所述标记符号的对应关系输出识别结果;所述识别结果包括所述文字内容和其对应的标记符号组成的结果对。
2.根据权利要求1所述的文本的识别方法,其特征在于,所述获取所述待识别文本图像对应的特征序列,包括:
对所述待识别文本图像进行多次卷积和多次池化,获取所述待识别文本图像对应的特征序列。
3.根据权利要求2所述的文本的识别方法,其特征在于,所述对所述待识别文本图像进行多次卷积和多次池化,获取所述待识别文本图像对应的特征序列,包括:
对所述待识别文本图像进行一次卷积和一次池化,获取第一结果;
对所述第一结果进行两次卷积和一次池化,获取第二结果;
对所述第二结果进行四次卷积和一次池化,获取第三结果;
对所述第三结果进行两次卷积和一次池化,获取第四结果;
对所述第四结果进行一次卷积,获取所述待识别文本图像对应的特征序列。
4.根据权利要求1-3任一项所述的文本的识别方法,其特征在于,所述获取所述特征序列中每个特征对应的文字内容,包括:
根据所述特征序列,获取所述特征序列中每个特征对应的文字概率矩阵;
根据所述文字概率矩阵中最大概率值对应的文字内容,获取所述每个特征对应的文字内容。
5.根据权利要求4所述的文本的识别方法,其特征在于,所述获取所述特征序列中每个特征对应的文字概率矩阵,包括:
对所述特征序列进行双向长短时记忆传播,获取所述每个特征对应的文字概率矩阵和标记符号概率矩阵。
6.根据权利要求5所述的文本的识别方法,其特征在于,所述根据所述特征组和所述文字内容的对应关系,获取所述特征组对应的标记符号,包括:
根据所述特征组和所述文字内容的对应关系,以及所述每个特征对应的标记符号概率矩阵,获取所述特征组对应的标记符号概率矩阵;
根据所述特征组对应的标记符号概率矩阵中最大概率值对应的标记符号,获取所述特征组对应的标记符号。
7.根据权利要求6所述的文本的识别方法,其特征在于,所述获取所述特征组对应的标记符号之后,还包括:
根据所述特征组和所述文字内容的对应关系,获取首个文字内容对应的特征组;
根据所述特征组对应的标记符号概率矩阵,以及所述首个文字内容对应的特征组,获取所述首个文字内容对应的标记符号概率矩阵;
若所述首个文字内容对应的标记符号概率矩阵中的目标概率值大于等于概率阈值,调整所述首个文字内容对应的标记符号,所述目标概率值为首个文字内容无标记符号的概率值之外的概率值。
8.根据权利要求7所述的文本的识别方法,其特征在于,所述调整所述首个文字内容对应的标记符号,包括:
若所述首个文字内容对应的标记符号概率矩阵中的第一标记符号概率值大于等于第二标记符号概率值,将第一标记符号确定为所述首个文字内容对应的标记符号。
9.根据权利要求1所述的文本的识别方法,其特征在于,所述获取所述待识别文本图像对应的特征序列之前,还包括:
对所述文本图像进行预处理,获取所述待识别文本图像,其中,所述待识别文本图像的高度为2的倍数。
10.一种文本的识别装置,其特征在于,包括:
特征序列获取模块,用于接收待识别文本图像,获取所述待识别文本图像对应的特征序列,其中,所述待识别文本图像包括:文字内容和标记符号;
关系建立模块,用于获取所述特征序列中每个特征对应的文字内容,建立特征组和所述文字内容的对应关系,其中,一个所述特征组包括至少一个特征,一个所述特征组内的特征对应同一个文字内容;
标记符号获取模块,用于根据所述特征组和所述文字内容的对应关系和所述特征序列中每个特征对应的标记符号,获取所述特征组对应的标记符号,其中,一个特征组内的特征对应同一个标记符号;
关系获取模块,用于根据所述特征组和所述文字内容的对应关系,以及所述特征组对应的标记符号,获取所述文字内容和所述标记符号的对应关系;
识别结果输出模块,用于根据所述文字内容和所述标记符号的对应关系输出识别结果;所述识别结果包括所述文字内容和其对应的标记符号组成的结果对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110323752.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种判题方法、装置、电子设备及存储介质
- 下一篇:烟炱分散剂





