[发明专利]一种自动化光学图像识别方法及其装置在审
申请号: | 201611036217.3 | 申请日: | 2016-11-22 |
公开(公告)号: | CN108090399A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 熊蜀光;黄琰;周迅溢;白建国;杨镜;兴百桥 | 申请(专利权)人: | 北京新唐思创教育科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100144 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 光学图像识别 样本集合 原始样本 图像识别 自动化 光学图像 图像变化 学习工具 申请 采集 学习 更新 | ||
本申请实施例提供一种自动化光学图像识别方法及其装置,包括:采集进行光学图像识别的原始样本,并依据真实情况下的图像变化情况获得操作策略;根据所述操作策略对所述原始样本进行变换,获得所述原始样本的扩充样本集合;采用深度学习工具对所述扩充样本集合进行训练,获得深度学习模型;利用所述深度学习模型对输入的待识别光学图像进行计算,得到识别结果。本申请实施例能够在图像识别中提高图像识别率,且简便更新样本集合。
技术领域
本申请属于图像识别技术领域,具体涉及一种自动化光学图像识别方法及其装置。
背景技术
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。图像识别可能是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。
图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。例如模板匹配模型。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。例如有一个字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。
图像识别包括字符识别和图形识别,其中字符识别主要指文字识别,图形识别则包括指纹识别等各类非字符的识别。通常的字符识别仅指对包含汉字等字符的图片进行计算机自动识别,获得其中的字符。但是现有的光学图像识别的样本集合中包含的样本数量有限,且样本无法模拟真实环境下的图像变化,从而造成图像识别的识别率低下。并且,在增加新的样本或者出现新情形的图像变化时,需要人工更新样本集合,造成图像识别中样本扩充需要耗费大量的人力成本,无法简便的更新样本集合,
因此,如何在图像识别中提高图像识别率,且简便更新样本集合,成为现有技术中亟需解决的技术问题。
发明内容
本申请实施例解决的技术问题之一在于提供一种自动化光学图像识别方法及其装置,其能够在图像识别中提高图像识别率,且简便更新样本集合。
本申请实施例提供一种自动化光学图像识别方法,包括:
采集进行光学图像识别的原始样本,并依据真实情况下的图像变化情况获得操作策略;
根据所述操作策略对所述原始样本进行变换,获得所述原始样本的扩充样本集合;
采用深度学习工具对所述扩充样本集合进行训练,获得深度学习模型;
利用所述深度学习模型对输入的待识别光学图像进行计算,得到识别结果。
在本申请具体实施里中,所述采集进行光学图像识别的原始样本,并依据真实情况下的图像变化情况获得操作策略包括:
如采集进行光学图像识别的原始样本为光学字符图像,利用光学字符操作策略对所述字符图像进行扩充,获得所述原始样本的扩充样本集合;和/或,
如采集进行光学图像识别的原始样本为图形图像,利用图形操作策略对所述图形图像进行扩充,获得所述原始样本的扩充样本集合。
在本申请具体实施里中,所述光学字符操作策略包括:
对所述光学字符进行字形、字体、角度变换中至少一种形变操作策略。
在本申请具体实施里中,所述图形操作策略包括:
对所述图形进行形状变化、角度变换中至少一种形变操作策略。
在本申请具体实施里中,所述采用深度学习工具对所述扩充样本集合进行训练,获得深度学习模型具体为:采用卷积神经网络框架深度学习工具对所述扩充样本集合进行训练,获得二进制的深度学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新唐思创教育科技有限公司,未经北京新唐思创教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611036217.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:指纹辨识模块
- 下一篇:一种图像文本识别的方法和装置