[发明专利]一种基于布局信息分析的邮件图像方向辨别方法有效
申请号: | 201410250620.0 | 申请日: | 2014-06-06 |
公开(公告)号: | CN104050487B | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | 吕岳;吴琼;吕淑静 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06K9/46 |
代理公司: | 上海麦其知识产权代理事务所(普通合伙)31257 | 代理人: | 董红曼 |
地址: | 200062 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 布局 信息 分析 邮件 图像 方向 辨别 方法 | ||
1.一种基于布局信息分析的邮件图像方向辨别方法,其特征在于,包括以下步骤:
步骤1:标记图像中的连通元;
步骤2:将各个连通元划分至文本块中;其中,步骤2包括:
步骤2a:设定所述文本块的初始位置及数量;
步骤2b:将所述各个连通元划分至与其纵方向值距离最小的文本块中;
步骤2c:重新计算所述文本块中心的纵方向值;
步骤2d:计算所述文本块中心的纵方向位置变化值,并判断变化值是否大于阈值并且迭代次数是否小于最大迭代次数,结果为是,则重复步骤2b,否则进入步骤2e;
步骤2e:删除不含有所述连通元的所述文本块并计算保留文本块的边界信息;
步骤3:提取所述文本块的特征向量;
步骤4:通过所述特征向量训练分类器;
步骤5:通过所述分类器辨别图像的方向。
2.如权利要求1所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,进一步包括对图像进行预处理;所述预处理包括:将所述图像进行二值化和去噪。
3.如权利要求1所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,所述步骤1中,进一步包括:对所述连通元进行过滤。
4.如权利要求3所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,过滤的所述连通元包括以下:
靠近图像边界位置的所述连通元;
图像中由折痕形成的所述连通元;
小区域内密集噪声点构成的所述连通元;
地址贴或邮资贴的边缘形成的所述连通元;
前景像素点个数与面积之比大于阈值的所述连通元,所述阈值大于0且小于或等于1;
前景像素点个数与面积之比小于阈值的所述连通元,所述阈值大于0且小于1;
前景像素点个数小于阈值的连通元,所述阈值大于等于0。
5.如权利要求1所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,所述步骤2中,进一步包括以下步骤:
步骤2f:将所述文本块排序;
步骤2g:若相邻的所述文本块在纵方向的重合度大于所述文本块高度的二分之一,则合并所述文本块;
步骤2h:若相邻的所述文本块在纵方向重合度大于所述文本块高度的三分之一,且在横 方向重合度大于所述文本块宽度的四分之三,则合并所述文本块。
6.如权利要求1所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,所述步骤3中,所述特征向量由所述文本块结点的长度特征向量、相邻所述文本块结点间的纵方向距离特征向量和所述文本块结点到图像中轴线横方向距离特征向量依次连接组成。
7.如权利要求6所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,所述长度特征提取包括以下步骤:
步骤31a:根据所述文本块的左右边界值计算得到所述文本块链上每个结点的长度值;
步骤31b:将所述长度值归一化,得到所述文本块链的观察序列;
步骤31c:通过Baum-Wech算法训练得到隐含状态转移概率矩阵、观测状态转移概率矩阵和初始隐含状态概率矩阵;
步骤31d:根据所述隐含状态转移概率矩阵、所述观测状态转移概率矩阵和所述初始隐含状态概率矩阵,利用Viterbi算法求得所述观察序列的隐含状态序列;
步骤31e:通过所述隐含状态序列得到所述文本块结点的长度特征向量。
8.如权利要求6所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,所述纵方向距离特征提取包括以下步骤:
步骤32a:根据所述文本块结点的中心位置计算得到相邻所述文本块链之间的纵方向距离值;
步骤32b:将所述纵方向的距离值归一化;
步骤32c:通过所述归一化后的距离值得到相邻所述文本块结点之间纵方向距离特征向量。
9.如权利要求6所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,所述横方向距离特征提取包括以下步骤:
步骤33a:计算所述文本块链上每个结点到图像中轴线横方向的距离值;
步骤33b:将所述横方向的距离值归一化;
步骤33c:通过所述归一化后的距离值得到所述横方向距离特征向量。
10.如权利要求1所述的基于布局信息分析的邮件图像方向辨别方法,其特征在于,所述步骤4中,采用SVM模型的多项式核函数和径向基函数分别训练两个所述分类器;若两个所述分类器识别的结果一致,则输出识别结果;若两个所述分类器识别结果不一致,则输出图像无法识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410250620.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置