[发明专利]一种自动化光学图像识别方法及其装置在审
申请号: | 201611036217.3 | 申请日: | 2016-11-22 |
公开(公告)号: | CN108090399A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 熊蜀光;黄琰;周迅溢;白建国;杨镜;兴百桥 | 申请(专利权)人: | 北京新唐思创教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100144 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 光学图像识别 样本集合 原始样本 图像识别 自动化 光学图像 图像变化 学习工具 申请 采集 学习 更新 | ||
1.一种自动化光学图像识别方法,其特征在于,包括:
采集进行光学图像识别的原始样本,并依据真实情况下的图像变化情况获得操作策略;
根据所述操作策略对所述原始样本进行变换,获得所述原始样本的扩充样本集合;
采用深度学习工具对所述扩充样本集合进行训练,获得深度学习模型;
利用所述深度学习模型对输入的待识别光学图像进行计算,得到识别结果。
2.如权利要求1所述的方法,其特征在于,所述采集进行光学图像识别的原始样本,并依据真实情况下的图像变化情况获得操作策略包括:
如采集进行光学图像识别的原始样本为光学字符图像,利用光学字符操作策略对所述字符图像进行扩充,获得所述原始样本的扩充样本集合;和/或,
如采集进行光学图像识别的原始样本为图形图像,利用图形操作策略对所述图形图像进行扩充,获得所述原始样本的扩充样本集合。
3.如权利要求2所述的方法,其特征在于,所述光学字符操作策略包括:
对所述光学字符进行字形、字体、角度变换中至少一种形变操作策略。
4.如权利要求2所述的方法,其特征在于,所述图形操作策略包括:
对所述图形进行形状变化、角度变换中至少一种形变操作策略。
5.如权利要求1所述方法,其特征在于,所述采用深度学习工具对所述扩充样本集合进行训练,获得深度学习模型具体为:采用卷积神经网络框架深度学习工具对所述扩充样本集合进行训练,获得二进制的深度学习模型。
6.一种自动化光学图像识别装置,其特征在于,包括:
样本采集模块,用于采集进行光学图像识别的原始样本,并依据真实情况下的图像变化情况获得操作策略;
样本扩充模块,用于根据所述操作策略对所述原始样本进行变换,获得所述原始样本的扩充样本集合;
模型获得模块,用于采用深度学习工具对所述扩充样本集合进行训练,获得深度学习模型;
图像识别模块,用于利用所述深度学习模型对输入的待识别光学图像进行计算,得到识别结果。
7.如权利要求6所述的装置,其特征在于,所述样本扩充模块包括:
字符扩充单元,用于如采集进行光学图像识别的原始样本为光学字符图像,利用光学字符操作策略对所述字符图像进行扩充,获得所述原始样本的扩充样本集合;和/或,
图形扩充单元,用于如采集进行光学图像识别的原始样本为图形图像,利用图形操作策略对所述图形图像进行扩充,获得所述原始样本的扩充样本集合。
8.如权利要求7所述的装置,其特征在于,所述光学字符操作策略包括:
对所述光学字符进行字形、字体、角度变换中至少一种形变操作策略。
9.如权利要求7所述的装置,其特征在于,所述图形操作策略包括:
对所述图形进行形状变化、角度变换中至少一种形变操作策略。
10.如权利要求6所述装置,其特征在于,所述模型获得模块具体用于采用卷积神经网络框架深度学习工具对所述扩充样本集合进行训练,获得二进制的深度学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新唐思创教育科技有限公司,未经北京新唐思创教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611036217.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:指纹辨识模块
- 下一篇:一种图像文本识别的方法和装置