[发明专利]一种汉字字形视觉重心的确定方法有效
| 申请号: | 201310139606.9 | 申请日: | 2013-04-19 |
| 公开(公告)号: | CN103246636A | 公开(公告)日: | 2013-08-14 |
| 发明(设计)人: | 张俊松;李彬 | 申请(专利权)人: | 厦门大学 |
| 主分类号: | G06F17/21 | 分类号: | G06F17/21 |
| 代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭 |
| 地址: | 361000 *** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 汉字 字形 视觉 重心 确定 方法 | ||
技术领域
本发明涉及一种汉字字形视觉重心的确定方法,用于量化确定字形视觉重心。
背景技术
在汉字的结体中,“重心平稳”是最基本的要求,大量的书法著作中都有对其进行描述。所谓“重心”是从物理学上借用过来的术语,指重力在物体上的作用点。重心是汉字字形结构的关键,它处于字的心脏部位—中宫,构成了视觉重心,字的构成笔画和部首只有以它为中心,其结构才具有稳定性和均衡感,而又不失板滞。
在字体设计时,视觉重心是字体设计师关注的一个重要方面。因为只有汉字的视觉重心保持一致,读者阅读时才能确保阅读的流畅性和舒适性。因此汉字字形视觉重心的计算方法,在印刷体汉字自动生成,字形美化、字体排版等方面都具有重要的应用价值。
在一些汉字字形处理的工作中,已经有部分工作涉及汉字视觉重心计算。可以总结为以下几种方法:
1)通过计算汉字笔画区域黑色像素点坐标的平均值来表示汉字重心;
2)通过中心投影射线的焦点来刻画汉字重心;
3)分别计算出汉字图像上每一行列黑色像素点个数,然后统计出具有最多黑色像素点的行列,把其交叉点作为汉字重心。
以上这些汉字重心计算方法,大多是基于黑色像素点坐标位置进行局部运算,目前还没有一个有效的计算方法。
计算汉字视觉重心存在以下困难:
1)难以建立客观准确的汉字视觉重心度量与计算方法;
2)汉字重心与字形的许多因素有关,如基本笔画、间架结构、字体形态等,目前基于模式识别和图像处理的方法,还不能自动高效地提取出这些汉字特征。
发明内容
本发明的目的在于克服现有技术的不足,提供一种准确度量与计算汉字视觉重心,高效提取汉字特征的汉字字形视觉重心的确定方法。
本发明的技术方案如下:
一种汉字字形视觉重心的确定方法,步骤如下:
1)获取常用汉字样本图像;
2)确认汉字样本图像的笔画连通区域;
3)计算得出笔画连通区域质心;
4)利用笔画连通区域质心和整体汉字视觉重心之间的关系模型,计算得出汉字字形视觉重心。
作为优选,步骤2)通过对汉字样本图像进行包围盒计算,得到汉字样本图像的笔画连通区域。
作为优选,步骤2)具体为:首先对汉字样本图像尺寸不一的边缘部分进行包围盒计算,并对边缘部分进行剪切,得到汉字样本图像的笔画连通区域。
作为优选,步骤4)中笔画连通区域质心和整体汉字视觉重心之间的关系模型是利用统计分析方法建立得到。
作为优选,所述的关系模型为多元线性回归模型。
作为优选,多元线性回归模型的数学表达式定义为:r=g(x|w0,w1,…wi)+ε=w0+w1x1+w2x2+…+wixi+ε,
其中,w0,w1,…,wi称为回归系数,是i+1个待估参数,ε是随机变量。
作为优选,根据x1,x2,…,xi,r的N组数据(xk1,xk2,…,xki,rk),其中k=1,2,…,N,给出各回归系数wi的估计值w′i使得样本平方误差之和最小。
作为优选,所述的关系模型的输入参数为训练数据,通过将训练数据作为输入,得出关系模块的参数。
作为优选,步骤3)中质心的确认步骤为:计算得出汉字样本图像的各个笔画连通区域质心在x方向上的相对位置和y方向上的相对位置其中i=1,2,…...,7,表示连通区域的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310139606.9/2.html,转载请声明来源钻瓜专利网。





