[发明专利]扫描识别装置和方法有效
申请号: | 201110141320.5 | 申请日: | 2011-05-27 |
公开(公告)号: | CN102324027A | 公开(公告)日: | 2012-01-18 |
发明(设计)人: | 李永彬 | 申请(专利权)人: | 汉王科技股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 扫描 识别 装置 方法 | ||
技术领域
本发明属于计算机外围设备领域,涉及一种扫描识别装置和方法,具体涉及一种扫描识别所选择的字符序列的装置和方法。
背景技术
电子扫描笔(简称扫描笔)是OCR的重要应用之一。扫描笔的光学摄像头按照一定频率对被扫描资料进行连续拍照,获取被扫描资料的图像帧序列,然后将图像帧序列拼接成一幅全景图像后进行OCR处理。
用户在使用扫描笔扫描时,其扫描速度是变化的,一种典型的使用方式是,在刚刚开始扫描时,扫描笔的扫描速度从零开始逐渐增大,然后达到一个速度峰值,此后速度逐渐下降,直到扫描结束,在保证速度峰值时相邻图像帧之间有一定重叠内容的情况下,扫描速度越低,相邻图像帧之间的重叠内容越多,换言之,当扫描速度较小时,当前图像帧不但与其前一图像帧有重叠内容,而且很可能与其前一帧之前的一个或多个图像帧也有一定的重叠内容,当扫描速度很小时,当前图像帧一定与其前一帧之前的一个或多个图像帧有一定的重叠内容。
另外,随着硬件技术的提高,为了提高扫描笔支持的扫描速度峰值,提高用户的使用感受,可以使用更高采样频率的光学传感器,当扫描笔的光学传感器采样频率提高时,相比于较低的采样频率,在相同扫描速度下当前图像帧与其前一帧之前的一个或多个图像帧有一定的重叠内容的概率更高。
授权公告号CN1160657C的专利公开了一种文字的记录方法和装置,该装置扫过选择字符序列时,光学传感器同步记录多个内容部分重叠的图像,信号处理单元将这些图像水平、垂直地组合成为一幅全景图像,并将全景图像中的字符识别后存储在装置中。但该发明的信号处理单元只能通过重叠内容将每个图像帧与前一个图像帧垂直地和水平地组合,这样每两帧相邻的图像帧就必然进行组合。在当前图像帧与其前一帧之前的一个或多个图像帧也有一定的重叠内容时,每两帧相邻的图像帧进行组合拼接的方式,不但使信号处理单元的负荷大大加重,占用了硬件资源,而且也降低了整个图像帧序列的拼接速度。
发明内容
本发明所要解决的技术问题为提供了一种扫描识别装置和方法,通过对采集到的图像帧序列中的图像帧进行筛选,对得到的待拼接图像帧根据重叠内容进行拼接,降低了控制模块的处理负荷,提高了整个图像帧序列的拼接速度。
本发明公开了一种扫描识别装置,包括用于拍摄图像的光学传感器和用于处理图像及识别字符的控制模块,所述光学传感器对被扫描字符进行连续拍摄以得到含有被扫描字符的图像帧序列,所述图像帧序列中每帧图像的内容与前一帧图像的内容部分重叠;所述控制模块通过重叠内容将图像帧序列中的每帧图像与相关的图像帧进行拼接合成一个全景图像,对所述全景图像进行倾斜校正后进行字符识别,得到被扫描字符的字符编码。
所述控制模块包括:
设置单元,设置图像帧序列中的当前帧的帧属性,形成图像帧组,帧属性包括基准帧、预测帧和跳过帧;
预测单元,根据当前帧的帧属性及相关图像帧的拼接信息的更新值计算当前帧的拼接信息的预测值;
搜索单元,根据当前帧的拼接信息的预测值搜索当前帧的拼接信息的计算值;
更新单元,根据当前帧的拼接信息的计算值计算当前帧的拼接信息的更新值,转至设置单元,直至图像帧序列中各基准帧、预测帧的拼接信息的更新值计算完毕;
拼接单元、根据计算完毕的各基准帧、预测帧的拼接信息的计算值拼接为全景图像。
本发明还公开了一种扫描识别方法,包括如下步骤:
步骤一,对被扫描字符进行连续拍摄以得到含有被扫描字符的图像帧序列,所述图像帧序列中每帧图像的内容与前一帧图像的内容部分重叠;
步骤二,装置中的控制模块通过重叠内容将图像帧序列中的每帧图像与相关的图像帧进行拼接合成一个全景图像;
步骤三,对所述全景图像进行倾斜校正后进行字符识别,得到被扫描字符的字符编码。
进一步,所述方法的步骤二包括:
步骤a,设置图像帧序列中的当前帧的帧属性,形成图像帧组,帧属性包括基准帧、预测帧和跳过帧;
步骤b,根据当前帧的帧属性及相关图像帧的拼接信息的更新值计算当前帧的拼接信息的预测值;
步骤c,根据当前帧的拼接信息的预测值搜索当前帧的拼接信息的计算值;
步骤d,根据当前帧的拼接信息的计算值计算当前帧的拼接信息的更新值,转至步骤a,直至图像帧序列中各基准帧、预测帧的拼接信息的更新值计算完毕;
步骤e、根据计算完毕的各基准帧、预测帧的拼接信息的计算值拼接为全景图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110141320.5/2.html,转载请声明来源钻瓜专利网。