[发明专利]基于CTC深度神经网络的文字分割和识别的方法在审
申请号: | 202010294624.4 | 申请日: | 2020-04-15 |
公开(公告)号: | CN111507348A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 侯进;黄贤俊 | 申请(专利权)人: | 深源恒际科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京智沃律师事务所 11620 | 代理人: | 吴志宏 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于CTC深度神经网络的文字分割和识别的方法,包括如下步骤:a1.对输入图像利用CNN提取特征;a2.对a1提取的特征进行CELL切分,CELL的高宽固定,个数由图像长度确定;a3.对确定好的特征每个CELL直接分割分类,输出分割信号;a4.利用CTCLOSS计算真实分割信号与模型输出的分割信号之间的损失,损失情况反馈并训练整个模型;a5.利用a3输出的分割信号对文本进行分割,并对单个字符进行CNN+softmax分类识别,真实分割信号由标注文本映射而来,CTCLOSS可自动解决文本对齐问题。本发明提升了OCR识别的速度,且切成单个字符后其识别优化具有针对性,使得最终精度提高;对识别框架进行改进,将识别过程分离为字符分割、单字符识别,使得优化可以分开的、具有针对性的进行。 | ||
搜索关键词: | 基于 ctc 深度 神经网络 文字 分割 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深源恒际科技有限公司,未经深源恒际科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010294624.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种油门杆推杆速度的确定方法
- 下一篇:一种频率可调的高声压级传声器校准装置