[发明专利]基于聚类和蚁群算法的横纵切碎片复原方法有效

申请号：	201710162924.5	申请日：	2017-03-19
公开（公告）号：	CN106952230B	公开（公告）日：	2021-02-02
发明（设计）人：	刘有军;陈军华	申请（专利权）人：	北京工业大学
主分类号：	G06T3/40	分类号：	G06T3/40;G06K9/62
代理公司：	北京思海天达知识产权代理有限公司 11203	代理人：	刘萍
地址：	100124 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于算法切碎复原方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于聚类和蚁群方法的横纵切碎片复原方法，其特征在于，包括如下步骤：

1.1.根据每一个碎片中文字的位置信息提取每一个碎片的特征向量CV＝[a₁，a₂，a₃，a₄]^T，向量元素a₁，a₂，a₃，a₄为自然数；

1.2.以每行碎片的首个碎片的特征向量为聚类方法的中心向量对碎片进行分行聚类；

1.3.对每一行进行排序，把碎片行内拼接问题转化为旅行商问题，应用蚁群方法求解这个旅行商问题；

1.4.使用合并策略和分治策略提高行内碎片的拼接精度；

1.5.使用行碎片的特征向量进行匹配实现行碎片的拼接；

所述的步骤1.1包括：

2.1.如果碎片的顶部是白的，则该碎片顶部中不存在不完整的文字行，令a₁＝0；

2.2.如果碎片的顶部第一行文字是完整的，则令a₁＝0，即该行文字的上边界与碎片的上边界重叠；否则令a₁＝l₁，其中l₁是碎片顶部不完整行的底部在碎片的位置，用数字表示；

2.3.如果碎片的底部是白的，则该碎片的底部不存在不完整的文字行，令a₄＝0；

2.4.如果碎片的底部最后一行文字是完整的，则令a₄＝0，即该行文字的上边界与碎片的下边界重叠；否则令a₄＝l₄，其中l₄是碎片底部不完整行的顶部到碎片顶部的距离；

2.5.如果碎片中包含任意一行完整的文字，则令a₂＝l₂，a₃＝l₃，其中l₂是最靠近碎片底部的那行完整的文字的上边界到碎片顶部的距离，l₃是最靠近碎片底部的那行完整的文字的下边界到碎片顶部的距离，否则令a₂＝0，a₃＝0并跳转执行步骤2.7；同时令l＝l₂-l₃，l′＝a₄-a₃，其中l是一行文字的字高，l′是文字行之间空隙的高度，如果某个碎片中没有任何完整的行，导致无法计算l，l′，此时用来自于同一个文件的其他碎片的平均值代替；

2.6.如果a₃＜L-l-l′，其中L是碎片的高度，把a₂，a₃修正为a₂＝a₂+l+l′，a₃＝a₃+l+l′；如果修正后的a₃和未修正的a₄满足条件a₃+l′≤L∪a₄＝0，则把a₄修正为a₄＝a₃+l′；如果修正后的a₂和未修正的a₁满足条件(0≤a₂-N(l′+l)≤l)∪a₁＝0时，把a₁修正为a₁＝a₂-N(l′+l)，参数N为整数；结束特征向量提取；

2.7.如果a₁＝0，a₄＝0，这意味着该碎片中没有文字信息，把该碎片从重建复原问题中移除；否则利用a₁，a₄，l，l′对a₂，a₃进行修正并结束特征向量提取；

所述步骤1.2包括：

3.1.根据每一行碎片首个碎片的左边是一片空白的特点寻找每行首个碎片，并以该碎片对应的特征向量为聚类方法的聚类中心向量；该碎片对应的特征向量标记为CV′₁，CV′₂，......CV′_m，其中m表示文件被切成碎片的行数；

3.2.若碎片s的特征向量与聚类中心向量t的差向量的一范数满足条件|CV_s-CV_t|≤T_th，则碎片s与该聚类中心向量t对应的碎片属于同一行，其中T_th是一个阈值，为碎片图像中像素点行数的二十分之一；

3.3.对于所有碎片执行步骤3.2进行聚类分行；

所述的步骤1.3包括：

4.1.聚类分行结果中的每一行都单独处理，把每行的碎片抽象成图论中的顶点，碎片边缘矩阵之间的匹配度抽象成顶点之间的距离；

4.2.利用公式计算顶点i到顶点j的距离d_l(i，j)，即碎片i的右边缘与碎片j的左边缘；计算任意顶点之间的距离得到一张完全赋权图；

其中V_i(y)表示碎片i的图像的右边缘在y点的灰度值，V_j(y)表示碎片j的左边缘在位置y处的灰度值；e(i，j，y)表示碎片i的右边缘与碎片j的左边缘在位置y处的距离，e′(i，j，y)是e(i，j，y)二值化之后的结果，τ是二值化的阈值，为200；

上述公式的y需要满足条件y∈[3，L-2]∩y∈N^*，其中N^*表示正整数，当不满足条件时用公式e(i，j，y)＝|V_i(y)-V_j(y)|计算碎片在y点的距离；

4.3.使用蚁群方法计算结果，蚁群方法的参数设为α＝1，β＝5，ρ＝0.5，其中α代表启发因子，β代表自启发量因子，ρ代表信息素残留系数；蚁群方法中的蚂蚁数量设置为碎片的数量；

4.4.若拼接结果每一行都无拼接错误，则跳转至步骤1.5，如果有拼接错误，则把有错误行的碎片跳转至步骤1.4重新计算拼接；

所述的步骤1.4包括：

5.1.当碎片i的右边缘与碎片j的左边缘的距离d_l(i，j)＜T_th时，把碎片i，j合并为新的碎片，以碎片i的左边缘作为新碎片的左边缘，以碎片j的右边缘为新碎片的右边缘，其中T_th含义与步骤3.2相同；

5.2.把合并后的碎片重新重复步骤4.1到步骤4.3计算得到更加精确的结果，若拼接结果每一行都无拼接错误，则结束步骤1.4，执行步骤1.5；如果有拼接错误，则把有错误行的碎片跳转至步骤5.3重新计算拼接；

5.3.对于同行碎片中文字行数不一样的碎片分类处理，对每一类重复步骤4.1到步骤4.3直至拼接无错误或者尝试拼接10次以上仍未完全拼接正确；

所述步骤1.5包括：

6.1.根据步骤1.1确定每一行碎片的特征向量CVC_i＝[a₁，a₂，a₃，a₄]；

6.2.根据碎片第一行上部空白没有文字的特点确定碎片的第一行以及其特征向量为CVC₁，令当前待拼接行的特征向量为CVC_C初始值设定为CVC_C＝CVC₁；

6.3.若某行碎片的特征向量CVC_i的分量与当前待拼接特征向量CVC_C满足条件或者时认为行碎片i与当前待拼接纸片相邻，完成对行碎片i的拼接，令CVC_C＝CVC_i，其中δ是随机误差容忍度，δ设定为3，n∈{1，2}；其中表示当前待拼接行的特征向量CVC_C的分量a₄，表示某行碎片的特征向量CVC_i的分量a₁；表示当前待拼接行的特征向量CVC_C的分量a₃，表示某行碎片的特征向量CVC_i的分量a₂；

6.4.重复步骤6.3直到行碎片拼接完成。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京工业大学，未经北京工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710162924.5/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T3-00 在图像平面内的图形图像转换，例如，从位像到位像地建立一个不同图像
G06T3-20 .整个或部分图形的线性转换，如面位显示
G06T3-40 .整个或部分图形的定标
G06T3-60 .整个或部分图形的旋转

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于聚类和蚁群算法的横纵切碎片复原方法有效

专利文献下载