[发明专利]一种雕刻文字识别方法、系统及存储介质有效
申请号: | 201910255132.1 | 申请日: | 2019-04-01 |
公开(公告)号: | CN110175603B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 林健发;李飞洋;邓学良;肖盼 | 申请(专利权)人: | 佛山缔乐视觉科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
地址: | 528200 广东省佛山市南海区狮山镇*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 雕刻 文字 识别 方法 系统 存储 介质 | ||
1.一种雕刻文字识别方法,其特征在于:包括以下步骤:
通过双目摄像机自动采集被测物体的图像;
通过卷积操作和反卷积操作对采集到的图像进行处理,生成深度图;
通过区域推荐网络提取深度图中的文字区域;
基于双向长短期记忆网络,对文字区域进行文字识别,得到雕刻文字的识别结果;
所述通过卷积操作和反卷积操作对采集到的图像进行处理,生成深度图这一步骤,包括以下步骤:
通过卷积操作对采集到的图像进行第一处理,得到特征图;
通过反卷积操作对特征图进行第二处理,得到深度图;
所述通过卷积操作对采集到的图像进行第一处理,得到特征图这一步骤,包括以下步骤:
通过第一卷积核对采集到的图像进行升维操作,得到第一通道和第二通道;
通过两个第二卷积核对第一通道进行特征提取,并通过一个第二卷积核对第二通道进行特征提取;
通过第一卷积核分别对第一通道和第二通道进行卷积操作;
根据激活函数,将采集到的图像与卷积操作的结果进行结合操作;
通过最大池化层对结合操作的结果进行采样,得到特征图;
所述通过反卷积操作对特征图进行第二处理,得到深度图这一步骤,包括以下步骤:
通过损失函数来度量预测深度图与真实深度图的误差程度;
计算双目视觉系统的视差;
根据计算得到的视差进行图像预测;
对预测得到的图像进行平滑处理,生成深度图;
所述通过区域推荐网络提取深度图中的文字区域这一步骤,包括以下步骤:
基于深度图,通过区域推荐网络生成候选区域;
通过回归器判断候选区域内的文字状态;
根据文字状态的判断结果,通过分类器对候选区域中的文字区域进行标记;
其中,所述文字区域的定位任务的损失函数为:
其中,pi是第i个anchor box预测包含文字的概率,为文字/非文字标签;tj是第j个anchor box预测的坐标,是该anchor box对应的真实标注坐标;ok是第k个anchorbox预测的x轴偏移量,是该anchor box对应的真实x轴偏移量。
2.根据权利要求1所述的一种雕刻文字识别方法,其特征在于:所述通过双目摄像机自动采集被测物体的图像这一步骤,包括以下步骤:
控制光源与被测物体之间的倾斜角满足预设要求;
对光源进行旋转控制;
对光源进行亮度调节;
对被测物体进行旋转控制。
3.根据权利要求1所述的一种雕刻文字识别方法,其特征在于:所述基于双向长短期记忆网络,对文字区域进行文字识别,得到雕刻文字的识别结果这一步骤,包括以下步骤:
通过卷积神经网络对文字区域进行第三处理,得到特征序列;
通过双向长短期记忆网络对特征序列进行第四处理,得到上下文信息;
根据上下文信息,对观测样本进行最大似然估计;
根据最大似然估计的结果,得到雕刻文字的识别结果。
4.一种雕刻文字识别系统,其特征在于:包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-3中任一项所述的雕刻文字识别方法。
5.一种存储介质,其中存储有处理器可执行的指令,其特征在于:所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-3中任一项所述的雕刻文字识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山缔乐视觉科技有限公司,未经佛山缔乐视觉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910255132.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:纺丝机监控方法、纺丝机监控设备和纺丝机
- 下一篇:定位方法和移动终端