[发明专利]一种文本图像的拼接方法及系统有效

专利信息
申请号: 201010558966.9 申请日: 2010-11-25
公开(公告)号: CN102074001A 公开(公告)日: 2011-05-25
发明(设计)人: 黄灿;龙腾;镇立新 申请(专利权)人: 上海合合信息科技发展有限公司
主分类号: G06T5/50 分类号: G06T5/50
代理公司: 上海光华专利事务所 31219 代理人: 王松
地址: 200433 上海市杨浦区复旦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 图像 拼接 方法 系统
【说明书】:

技术领域

本发明属于图像处理技术领域,涉及一种图像的拼接方法,尤其涉及一种文本图像的拼接方法;同时,本发明还涉及一种文本图像的拼接系统。

背景技术

随着越来越多的手机集成了相机拍照功能,基于计算机视觉技术的应用软件在手机上逐渐丰富起来,一种典型应用就是利用手机上的相机来扫描或者拍摄文本图像,实现传统扫描仪的功能。由于手机能移动携带而且用手机上的相机来扫描,使用起来也非常方便,因此手机上的扫描仪是一种非常有前景的应用。

而目前的手机上的扫描仪功能,都是先用相机拍摄文本图片后,再加上一些图像预处理,就得到最终的扫描结果。这种手机扫描仪软件都存在一个比较明显的缺点就是:当所拍摄的文本(文档)比较大时,由于相机相对离的较远,此时得到的图像中文字分辨率比较低,图片中的文字都不是很清楚。

为了提高文本图像的分辨率,使所有的文字都清晰可辨,有着跟传统扫描仪一样的高质量扫描效果,一种有效的解决方案就是先使相机离文档很近,拍摄出文档的各个局部图片,然后再将所有的这些局部文档图片拼接起来,最后得到一个完整的高分辨全图。采用局部图像来拼接大图一个优点就是,相机离文档近了,对焦更准,受到噪声干扰的影响也将随之降低,另外多幅局部图片拼接出来的扫描结果,将有更高的分辨率,像素可以达到千万。以Iphone 3GS手机为例,该手机所带的相机像素为320万,如果采用五六幅320万像素的局部文本图像拼接成一个大图,最后就能得到一幅高达一千多万像素的文本图像。

将局部文本图像拼接成一个完整的大图,该方法跟全景拼图很类似。如一些文献公开了专门介绍图像拼接的技术:R Szeliski,“Image alignment andstitching:A tutorial”,Foundations and Trends in Computer Graphics andVision,2006.

现有技术已经存在一些将多张图片拼接成大图的解决方案,如中国专利CN200810237427.8公开了一种无控制点的图像拼接方法包括以下步骤:(1)获取图像序列;(2)提取图像序列中每幅图像的特征点集;(3)搜索相邻两幅图像之间的特征点的同名点对;(4)利用RANSAC容错算法计算相邻图像之间的Homograph变换关系;(5)利用连乘公式和融合技术得到拼接结果。专利CN200710121181.3公开了一种基于特征匹配的大幅面文化遗产图像的拼接方法,涉及图像匹配、图像拼接领域。具有以下处理步骤:1)针对文化遗产图像的特点,采用角点检测的方法提取图像中的角点作为图像的特征用于图像间的匹配;2)计算相邻图像匹配点间所连直线斜率,利用斜率相同或相近的特点,使用聚类的方法预筛选图像间的相关点;3)使用最佳路径的方法生成一条像素差值较小的拼接路径,以避开像素差异较大区域,达到消鬼影的目的;4)使用HSI颜色空间中的亮度分量,按照拼接路径运用权重函数公式对亮度进行融合。

但是对于一般的全景拼图软件,都是先拍摄好所有的局部图像,然后用户将所有这些图片传到软件中进行处理,最后通过算法处理拼接得到一幅全景图。这种方法的一个缺点就是:“它需要每幅局部图像之间要有重叠区域,如图像重叠区域过小,或者重叠区域没有纹理信息。那么各个局部图像之间的拼接将会失败,这也是现在全景拼图软件常存在的问题。”为了让各个局部图像相互之间有重叠区域,那么用户在拍摄的时候就不能随意乱拍文档了,必须依次拍摄,而且保证各个拍摄的局部图像有重叠。这种有很多限制要求的拍摄方式对于手机用户来说及其不方便。

另外一个缺点:对于多幅平面文档图像进行拼接时,如拼接第一幅和第二幅,需要确定一个变换的参考平面,假如用第一幅文本图像所在的平面作为参考平面。要将第二幅文本图像通过透视变换矩阵变换到到第一幅图像所在的参考平面后,才能和第一幅图像进行拼接得到拼接后的图像。如果要将第三幅再进行拼接时,此时以第一第二幅所拼接出来的图像所在的平面作为参考平面,将第三幅图片变换过去来做拼接,但此时很有可能是第三幅图像与第二幅图像之间才有重叠区域,而变换矩阵是根据这个重叠区域得到的特征匹配对计算出来的。而因为从第二幅变换到第一幅有误差,第三幅变换到第二幅也有误差,最后计算第三幅到第一幅的变换时,此时导致参考平面的累计误差比较大,使最后得到的文档全图,看起来是扭曲弯折的。

为了解决拍摄的局部图像没有重叠区域或者因为重叠区域特征不明显,导致图片无法拼接起来的问题,另外还有参考平面不统一,造成累计误差的情况,本申请人提出了一种基于模板图像来进行特征匹配的文本全图拼接方法。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海合合信息科技发展有限公司,未经上海合合信息科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010558966.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top