[发明专利]一种字符智能识别方法及识别装置有效
申请号: | 201910149728.3 | 申请日: | 2019-02-28 |
公开(公告)号: | CN109919154B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 汪红兵;魏书琪;陈新坜 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 智能 识别 方法 装置 | ||
本发明提供一种字符智能识别方法及识别装置,能够提高钢板字符的识别准确率。所述方法包括:获取含有待识别钢板字符的目标图片;对所述目标图片进行识别,得到所述目标图片中各个待检字符的标签、位置坐标及识别置信度;根据得到的所述目标图片中各个待检字符的位置坐标及识别置信度,确定所述目标图片中各个待检字符的位置置信度;根据得到的位置置信度对得到的待检字符的标签进行筛选,得到所述目标图片中的钢板字符。本发明涉及金属材料图像识别领域。
技术领域
本发明涉及金属材料图像识别领域,特别是指一种字符智能识别方法及识别装置。
背景技术
钢板号是标识钢铁制造流程中产品工艺、生产批次等重要特征信息的数字序列。建立以钢板号为关键字的标准化设计和分类方法,根据钢板号来完成对钢铁产品的跟踪和管理成为流程自动化的关键环节。
一般的机器视觉系统解决方案由光源控制器对相机和光源的工作进行控制,工业相机将拍摄的数据传回服务器进行信息的提取过程,用户通过终端PC连接至服务器,PC上运行字符智能识别系统完成字符的识别,识别结果保存至服务器或上传给其他现场系统,如图1所示。
目前,深度学习在字符识别领域得到蓬勃发展。以深度卷积神经网络为代表的深度学习的识别模型中,均使用了非极大值抑制(Non-Maximum Suppression,NMS)的方法,这是一种对冗余检测结果进行消除的方式,避免对同一字符或物体进行重复检出。该方法对检测结果进行分组,保留每组中检测结果的识别置信度最高的检测结果;其中,分组以交并比为依据,交并比即两检测区域的交集与并集之比,当两检测区域交并比大于某一阈值,即认定两个区域包含一个冗余检测区域,将两检测区域置于同一组中。该方式计算简单,但根据最高识别置信度来识别钢板字符,其识别准确率低。
发明内容
本发明要解决的技术问题是提供一种字符智能识别方法及识别装置,以解决现有技术所存在的根据最高识别置信度来识别钢板字符,识别准确率低的问题。
为解决上述技术问题,本发明实施例提供一种字符智能识别方法,包括:
获取含有待识别钢板字符的目标图片;
对所述目标图片进行识别,得到所述目标图片中各个待检字符的标签、位置坐标及识别置信度;
根据得到的所述目标图片中各个待检字符的位置坐标及识别置信度,确定所述目标图片中各个待检字符的位置置信度;
根据得到的位置置信度对得到的待检字符的标签进行筛选,得到所述目标图片中的钢板字符。
进一步地,所述对所述目标图片进行识别,得到所述目标图片中各个待检字符的标签、位置坐标及识别置信度包括:
利用预先确定的使用非极大值抑制的识别模型对所述目标图片进行识别,得到所述目标图片中各个待检字符的标签、位置坐标及识别置信度。
进一步地,所述识别模型包括:深度卷积神经网络。
进一步地,位置置信度表示为:
其中,LOC CONFx为字符x的位置置信度,CONFx为识别置信度,α是调节因子,N为字符的数目,Lx为待检字符空间位置坐标,W是字符总宽度,ω为字符尺寸系数,i为字符序列数,为基准点空间位置坐标,Loffset为坐标偏置。
进一步地,所述根据得到的位置置信度对得到的待检字符的标签进行筛选,得到所述目标图片中的钢板字符包括:
以位置置信度进行非极大值抑制,对交并比大于预设的交并比阈值的各组结果根据位置置信度进行排序,其中,每组结果包括:检测区域序号、组序号、待检字符的标签和位置置信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910149728.3/2.html,转载请声明来源钻瓜专利网。