[发明专利]一种基于显性与隐性线段检测的平面文档图像透视矫正方法在审
| 申请号: | 201710915701.1 | 申请日: | 2017-09-30 |
| 公开(公告)号: | CN107748887A | 公开(公告)日: | 2018-03-02 |
| 发明(设计)人: | 应自炉;朱健菲;陈鹏飞;陈俊娟;甘俊英;翟懿奎 | 申请(专利权)人: | 五邑大学 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32 |
| 代理公司: | 广州市红荔专利代理有限公司44214 | 代理人: | 吴伟文 |
| 地址: | 529020 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 显性 隐性 线段 检测 平面 文档 图像 透视 矫正 方法 | ||
1.一种基于显性与隐性线段检测的平面文档图像透视矫正方法,包括以下步骤:
S1)、通过相机采集纸质文档图片作为透视畸变图像;
S2)、获取透视畸变图像的宽w和高h,通过灰度变换将透视畸变图像变换为单通道的灰度图像;
S3)、通过LSD(Line Segment Detection)梯度聚类算法提取灰度图像内部的所有显性线段,并记录相应显性线段两端点的坐标,并用齐次坐标表示,若提取的显性线段数量小于4,或者不存在显性线段数,则通过自适应局部连接图(ALCM)提取文本行的隐性线段,并记录相应隐性线段的两端点的坐标,并用齐次坐标表示,如果显性线段的数量大于4,则无需再提取隐性线段,并将提取的显性线段或隐性线段存储到线段集合L={l1,l2,....li}中,其中,li={pi,qi},pi、qi为线段li两端点的坐标;
S4)、对步骤S3)中提取的显性线段或隐形线段进行长度、斜率的筛选,若线段长度满足L={li|li≥5},以及斜率满足则保留该线段,否则删除该线段;
S5)、根据透视畸变复原图像上任意一像素点b′=[x′,y′,0]T与其透视畸变图像上对应的像素点b=[x,y]T满足单应变换,具体如下:
从而得到透视畸变复原图像到透视畸变图像的单应变换矩阵H,即:
H=KR[e1 e2 -t]=KR{I-(t+e3)e3T},
其中,λ为齐次坐标点归一化系数,为相机内部参数矩阵,R∈SO(3)为旋转矩阵,为相机姿态矩阵,t=[0 0 -max(w,h)]T,为平移向量,I为3阶单位矩阵,T为矩阵转置,f为相机焦距,e1、e2、e3为坐标系中X、Y、Z轴的单位向量;
S6)、通过变换得到单应变换矩阵H的逆矩阵该逆矩阵H-1表示从透视畸变图像到透视畸变复原图像的变换关系;
S7)、将线段li的两端点坐标pi、qi引入代价函数,并通过LM(Levenberg-Marquardt)算法估算出相机焦距f及其在三维空间中的旋转角度θ=[θ1 θ2 θ3],从而得到单应变换矩阵H的逆矩阵H-1,最终得到畸变图像复原模型:
其中,代价函数的表达式具体为:
式中,归一化的线段权重,pi=(pi1,pi2,pi3)T,qi=(qi1,qi2,qi3)T为线段li两端点的齐次坐标,diμ(pi,qi)=min(|pi1/pi3-qi1/qi3|,|pi2/pi3-qi2/qi3|)表示表示线段在图像坐标系中在X轴或Y轴方向的最小投影长度,η为平衡两项设置的权重,a=max(w,h),w、h分别为图像的宽度与高度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五邑大学,未经五邑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710915701.1/1.html,转载请声明来源钻瓜专利网。





