[发明专利]基于OCR识别算法的学习扫描笔有效
| 申请号: | 202010826008.9 | 申请日: | 2020-08-17 |
| 公开(公告)号: | CN111950542B | 公开(公告)日: | 2021-07-09 |
| 发明(设计)人: | 阚德涛;余佑强 | 申请(专利权)人: | 湖南纽思曼存储科技有限公司 |
| 主分类号: | G06K9/22 | 分类号: | G06K9/22;G06K9/00;G06K9/62 |
| 代理公司: | 深圳快马专利商标事务所(普通合伙) 44362 | 代理人: | 赵亮 |
| 地址: | 410100 湖南省长沙市长沙县*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 ocr 识别 算法 学习 扫描 | ||
本发明提供一种基于OCR识别算法的学习扫描笔,所述学习扫描笔包括:处理器、存储器、摄像头、通信接口、电池、采集单元,该处理器存储器、摄像头、通信接口、采集单元通过总线连接。本机OCR识别算法带深度学习,在线时通过互联网服务器收集用户习惯,用户越多,识别率越高,是一个词典扫描笔。
技术领域
本申请涉及电子技术领域,尤其涉及一种基于OCR识别算法的学习扫描笔。
背景技术
扫描笔又名微型扫描仪或手刮式扫描笔,所谓的扫描笔,即是通过扫描技术,直接将图像,表格或者印刷字体等扫描到笔里存储或者直接传送到电脑,进行存储阅读或者编辑修改等操作。
OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
现有的OCR识别算法的扫描笔的准确率不高,影响了用户的体验度。
发明内容
本申请实施例公开了一种基于OCR识别算法的学习扫描笔,能够OCR识别算法确定的文字信息进行校对,进而提高文字信息识别的准确率,提高用户的体验度。
本申请实施例第一方面公开了一种基于OCR识别算法的学习扫描笔,所述学习扫描笔包括:处理器、存储器、摄像头、通信接口、电池、采集单元,该处理器存储器、摄像头、通信接口、采集单元通过总线连接,
采集单元,用于采集文本资料;
处理器,用于采用OCR识别算法对该文本资料进行识别得到初步文字识别结果,依据所述初步文字识别结果搜索与该初步文字识别结果匹配的文字模板;将初步文字识别结果按符号分成n个初步分段,将文字模板按符号分成n个模板分段,将n个初步分段中的每个初步分段与n个模板分段进行逐一比对,按每个初步分段中每个文字的置信率对初步分段进行调整得到每个分段的最终结果,将该最终结果确定为扫描仪的文字识别结果;
所述n为大于等于2的整数。
通过实施本申请实施例,本申请提供的技术方案在通过OCR识别算法得到初步识别结果后,搜索与该初步识别结果对应的文字模板,然后依据文字模板对该初步识别结果进行调整,由于该调整依据置信率来调整,因此其能够提高初步识别结果的准确率,提高了OCR识别的准确率,提高了用户体验度。
附图说明
以下对本申请实施例用到的附图进行介绍。
图1是本申请实施例提供的一种扫描笔的结构示意图;
图2是本申请实施例提供的一种输入数据与卷积核的示意图。
具体实施方式
下面结合本申请实施例中的附图对本申请实施例进行描述。
本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/“,表示前后关联对象是一种“或”的关系。
本申请实施例中出现的“多个”是指两个或两个以上。本申请实施例中出现的第一、第二等描述,仅作示意与区分描述对象之用,没有次序之分,也不表示本申请实施例中对设备个数的特别限定,不能构成对本申请实施例的任何限制。本申请实施例中出现的“连接”是指直接连接或者间接连接等各种连接方式,以实现设备间的通信,本申请实施例对此不做任何限定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南纽思曼存储科技有限公司,未经湖南纽思曼存储科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010826008.9/2.html,转载请声明来源钻瓜专利网。





