[发明专利]一种基于显性与隐性线段检测的平面文档图像透视矫正方法在审

专利信息
申请号: 201710915701.1 申请日: 2017-09-30
公开(公告)号: CN107748887A 公开(公告)日: 2018-03-02
发明(设计)人: 应自炉;朱健菲;陈鹏飞;陈俊娟;甘俊英;翟懿奎 申请(专利权)人: 五邑大学
主分类号: G06K9/32 分类号: G06K9/32
代理公司: 广州市红荔专利代理有限公司44214 代理人: 吴伟文
地址: 529020 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 显性 隐性 线段 检测 平面 文档 图像 透视 矫正 方法
【权利要求书】:

1.一种基于显性与隐性线段检测的平面文档图像透视矫正方法,包括以下步骤:

S1)、通过相机采集纸质文档图片作为透视畸变图像;

S2)、获取透视畸变图像的宽w和高h,通过灰度变换将透视畸变图像变换为单通道的灰度图像;

S3)、通过LSD(Line Segment Detection)梯度聚类算法提取灰度图像内部的所有显性线段,并记录相应显性线段两端点的坐标,并用齐次坐标表示,若提取的显性线段数量小于4,或者不存在显性线段数,则通过自适应局部连接图(ALCM)提取文本行的隐性线段,并记录相应隐性线段的两端点的坐标,并用齐次坐标表示,如果显性线段的数量大于4,则无需再提取隐性线段,并将提取的显性线段或隐性线段存储到线段集合L={l1,l2,....li}中,其中,li={pi,qi},pi、qi为线段li两端点的坐标;

S4)、对步骤S3)中提取的显性线段或隐形线段进行长度、斜率的筛选,若线段长度满足L={li|li≥5},以及斜率满足则保留该线段,否则删除该线段;

S5)、根据透视畸变复原图像上任意一像素点b′=[x′,y′,0]T与其透视畸变图像上对应的像素点b=[x,y]T满足单应变换,具体如下:

λxy1=λxλyλ=KR[I3×3|-t]x′y′01=K[Re1Re2-R t]x′y′1=Hx′y′1,]]>

从而得到透视畸变复原图像到透视畸变图像的单应变换矩阵H,即:

H=KR[e1 e2 -t]=KR{I-(t+e3)e3T},

其中,λ为齐次坐标点归一化系数,为相机内部参数矩阵,R∈SO(3)为旋转矩阵,为相机姿态矩阵,t=[0 0 -max(w,h)]T,为平移向量,I为3阶单位矩阵,T为矩阵转置,f为相机焦距,e1、e2、e3为坐标系中X、Y、Z轴的单位向量;

S6)、通过变换得到单应变换矩阵H的逆矩阵该逆矩阵H-1表示从透视畸变图像到透视畸变复原图像的变换关系;

S7)、将线段li的两端点坐标pi、qi引入代价函数,并通过LM(Levenberg-Marquardt)算法估算出相机焦距f及其在三维空间中的旋转角度θ=[θ1 θ2 θ3],从而得到单应变换矩阵H的逆矩阵H-1,最终得到畸变图像复原模型:

x′y′1=H-1xy1,]]>

其中,代价函数的表达式具体为:

(θ^,f^)=arg minθ,fΣ(pi,qi)∈LW(pi,qi)×diμ2(H-1pi,H-1qi)+η[max(a,f)min(a,f)-1]2,]]>

式中,归一化的线段权重,pi=(pi1,pi2,pi3)T,qi=(qi1,qi2,qi3)T为线段li两端点的齐次坐标,d(pi,qi)=min(|pi1/pi3-qi1/qi3|,|pi2/pi3-qi2/qi3|)表示表示线段在图像坐标系中在X轴或Y轴方向的最小投影长度,η为平衡两项设置的权重,a=max(w,h),w、h分别为图像的宽度与高度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五邑大学,未经五邑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710915701.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top